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《 C++ 程序 设计 语言 》( 原 书 第 4 版 ) 是 C++ 领域 最 经 典 的 参考 书 ， 介 绍 了 C++11 的 各 项 新 特性 和 
新 功能 。 全 书 共 分 四 部 分 。 第 一 部 分 (第 1 ~ 5 章 ) 是 引言 ， 包 括 C++ 的 背景 知识 ，C++ 语言 及 其 标 
准 库 的 简要 介绍 ; 第 二 部 分 (第 6 ~ 15 章 ) 介绍 C++ 的 内 置 类 型 和 基本 特性 ， 以 及 如 何 用 它们 构造 程 
序 ; 第 三 部 分 (第 16 ~ 29 章 ) 介绍 C++ 的 抽象 机 制 及 如 何 用 这 些 机 制 编写 面向 对 象 程序 和 泛 型 程序 ; 
第 四 部 分 (第 30 ~ 44 章 ) 概述 标准 库 并 讨论 一 些 兼 容 性 问题 。 
由 于 篇 幅 问 题 ， 原 书 中 文 版 分 两 册 出 版 ， 分 别 对 应 原 书 的 第 一 至 三 部 分 和 第 四 部 分 ， 这 一 册 为 第 四 
部 分 。 

本 书 适合 计算 机 及 相关 专业 本 科 生 用 作 C++ 课程 的 教材 ， 也 适合 C++ 程序 设计 新 手 和 开发 人 员 
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文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 化 断 性 的 优势 ; 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风 驭 。 在 商业 化 的 进程 中 ,美国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 壁 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 让， 我 国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国 家 在 其 计算 机 科学 
发 展 的 几 十 年 间 积 淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 
的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”。 自 1998 年 开始 ， 我 们 
就 将 工作 重点 放 在 了 六 选 、 移 译 国外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson， 
McGraw-Hill，Elsevier，MIT，John Wiley & Sons，Cengage 等 世界 著名 出 版 公司 建立 了 良 
好 的 合作 关系 ， 从 他 们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum，Bjarne Stroustrup， 
Brian W. Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey D. 
Ullman, Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, Larry L. 
Peterson 等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 从 书 的 品位 和 格调 。 

“计算 机 科学 丛书” 的 出 版 工作 得 到 了 国内 外 学 者 的 鼎力 相助 ， 国 内 的 专家 不 仅 提供 了 
中 肯 的 选 题 指导 ， 还 不 辞 劳 苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 
在 中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 , “计算 机 科学 处 书 ” 已 经 出 版 了 近 
两 百 个 品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书 
籍 。 其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因 素 使 我 们 
的 图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完 善 和 教材 改革 的 逐渐 
深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 人 一 个 新 的 阶段 ， 我 们 的 目标 是 尽 善 尽 
美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公司 欢迎 老师 和 读者 对 我 们 
的 工作 提出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 : www.hzbook.com = 
电子 邮件 : hzjsj@hzbook.com | 昌 
联系 电话 : ( 010 ) 88379604 
联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 华章 教育 


邮政 编码 : 100037 华章 科技 图 书 出 版 中 心 
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历时 近 两 年 ， 终 于 翻译 完了 《 C++ 程序 设计 语言 》( 原 书 第 4 版 )。 全 书包 含 44 章 ， 英 
文 原版 共有 1300 多 页 ， 是 C++ 语言 之 父 Bjarne Stroustrup 的 一 部 呕心沥血 之 作 。 

这 部 巨著 有 几 个 特点 : 

一 是 知识 结构 完整 ， 对 C++ 语言 的 介绍 非常 全 面 。 作 者 按照 “基本 功能 ”一 “抽象 机 
制 ” 一 “标准 库 ” 的 递 进 层 次 组 织 全 书 ， 由 浅 和 深 地 把 C++ 语言 的 方方面面 呈现 在 读者 的 
面前 。 各 种 水 平 、 各 种 背景 的 读者 都 能 在 书 中 找到 适合 自己 的 切 人 点 和 学 习 路 径 。 

二 是 对 细节 的 讲解 非常 深入 ， 有 利于 读者 了 解 和 掌握 语言 的 精华 。 作 为 C++ 语言 的 发 
明 者 和 主要 维护 者 ，Bjarne Stroustrup 在 撰写 本 书 时 绝 不 仅仅 满足 于 阐明 语法 和 知识 点 本 身 。 
他 试图 向 读者 揭示 各 个 语言 功能 的 设计 初衷 ， 以 及 他 对 各 种 制约 因素 是 如 何 考虑 并 妥协 的 。 
对 于 大 多 数 读者 来 说 ， 这 种 视角 新 奇 而 有 趣 。 他 们 不 再 只 是 被 动 的 学 习 者 ， 在 知道 了 “是 什 
么 ”和 “为 什么 ”之 后 ， 还 可 以 大 胆 地 揣测 “C++ 语言 接 下 来 该 如 何 继续 发 展 ”。 不 得 不 说 ， 
这 是 本 书 与 其 他 C++ 书籍 的 最 大 区 别 。 

三 是 作者 在 写作 中 融 人 了 很 多 自己 的 工程 实践 经 验 。 学 习 程 序 设 计 语 言 与 学 习 文 化 课 有 
很 大 的 不 同 。 设 计 程 序 的 过 程 是 一 门 艺 术 ， 程 序 语言 只 是 完成 艺术 作品 所 需 的 工具 。 举 个 例 
子 来 说 ， 由 于 各 种 各 样 的 原因 ， 在 C++ 中 存在 一 些 语言 特性 ， 它 们 的 功能 和 作用 非常 类 似 。 
那么 这 些 特 性 之 间 是 何 关系 ”在 遇 到 某 类 实际 问题 时 应 该 如 何 聪明 地 选择 ? 本 书 很 好 地 回答 
了 此 类 问题 。 

以 译 者 的 浅见 ， 程 序 员 应 该 是 艺术 家 (Artist)， 而 非 匠 人 Worker) 后 者 只 会 堆砌 
代码 ， 而 前 者 能 创造 出 美好 的 作品 。 这 也 应 该 是 Bjarne Stroustrup 写作 本 书 时 所 追求 的 吧 ! 

这 本 译 著 的 出 版 凝结 了 很 多 人 的 智慧 和 心血 ， 绝 非 译 者 二 人 独力 可 为 。 感 谢 机 械 工 业 出 
版 社 的 朱 支 、 关 敏 等 编辑 在 本 书 译 校 和 出 版 过 程 中 的 辛勤 付出 ， 她 们 给 予 了 我 们 很 多 无 私 的 
帮助 。 由 于 译 者 水 平 有 限 ， 书 中 难免 有 一 些 不 当 之 处 ， 奶 请 读者 不 音 批评 指正 。 





译 者 
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所 有 计算 机 科学 问题 ， 

都 可 以 通过 引入 一 个 新 的 间接 层次 来 解决 ， 
那些 已 有 过 多 间接 层次 的 问题 除外 。 
一 一 David J. Wheeler 


与 C++98 标准 相 比 ，C++11 标准 让 我 可 以 更 清晰 、 更 简洁 而 且 更 直接 地 表达 自己 的 
想法 。 而 且 ， 新 版 本 的 编译 器 可 以 对 程序 进行 更 好 的 检查 并 生成 更 快 的 目标 程序 。 因 此 ， 
C++11 给 人 的 感觉 就 像 是 一 种 新 语言 一 样 。 

在 本 书 中 ,我 追求 完整 性 (completeness)。 我 会 介绍 专业 程序 员 可 能 需要 的 每 个 语言 特 
性 和 标准 库 组 件 。 对 每 个 特性 或 组 件 ， 我 将 给 出 : 

@ 基本 原理 : 设计 这 个 特性 (组 件 ) 是 为 了 帮助 解决 哪 类 问题 ? 其 设计 原理 是 什么 ? 它 

有 什么 根本 的 局 限 ? 

e 规范 : 它 该 如 何 定义 ? 我 将 以 专业 程序 员 为 目标 读者 来 选择 内 容 的 详 略 程度 ， 对 于 
要 求 更 高 的 C++ 语言 研究 者 ， 有 很 多 ISO 标准 的 文献 可 供 查阅 。 

e 例子 : 当 单 独 使 用 这 个 特性 或 与 其 他 特性 组 合 使 用 时 ， 如 何 用 好 它 ? 其 中 的 关 
键 技术 和 习惯 用 法 是 怎样 的 ? 在 程序 的 可 维护 性 和 性 能 方面 是 否 有 一 些 隐 含 的 
问题 ? 

多 年 来 ， 无 论 是 C++ 语言 本 身 还 是 它 的 使 用 ， 都 已 经 发 生 了 巨大 改变 。 从 程序 员 的 角 
度 ， 大 多 数 改变 都 属于 语言 的 改进 。 与 之 前 的 版 本 相 比 ， 当 前 的 ISO C++ 标准 (ISO/IEC 
14882-2011， 通 常 称 为 C++11 ) 在 编写 高 质量 代码 方面 无 疑 是 一 个 好 得 多 的 工具 。 但 是 它 
好 在 哪里 ?现代 C++ 语言 支持 什么 样 的 程序 设计 风格 和 技术 ? 这 些 技术 靠 哪些 语言 特性 和 
标准 库 特 性 来 支撑 ? 精练 、 正 确 、 可 维护 性 好 、 性 能 高 的 C++ 代码 的 基本 构建 单元 是 怎样 
的 ? 本 书 将 回答 这 些 关键 问题 。 很 多 答案 已 经 不 同 于 1985、1995 或 2005 等 旧版 本 的 C++ 
语言 了 : C++ 在 进步 。 

C++ 是 一 种 通用 程序 设计 语言 ， 它 强调 富 类 型 、 轻 量 级 抽象 的 设计 和 使 用 。C++ 特别 
适合 开发 资源 受 限 的 应 用 ， 例 如 可 在 软件 基础 设施 中 发 现 的 那些 应 用 。 那 些 花费 时 间 学 习 高 
质量 代码 编写 技术 的 程序 员 将 会 从 C++ 语言 受益 良 多 。C++ 是 为 那些 严肃 对 待 编 程 的 人 而 
设计 的 。 人 类 文明 已 经 严重 依赖 软件 ， 编 写 高 质量 的 软件 非常 重要 。 

目前 已 经 部 署 的 C++ 代码 达到 数 十 亿 行 ， 因 此 程序 稳定 性 备 受 重视 一 一 很 多 1985 年 和 
1995 年 编写 的 C++ 代码 仍然 运行 良好 ， 而 且 还 会 继续 运行 几 十 年 。 但 是 ， 对 所 有 这 些 应 用 
程序 ， 都 可 以 用 现代 C++ 语言 写 出 更 好 的 版 本 ; 如 果 你 墨守成规 ， 将 来 写 出 的 代码 将 会 是 
低 质 量 、 低 性 能 的 。 对 稳定 性 的 强调 还 意味 着 ， 你 现在 遵循 标准 写 出 的 代码 ， 在 未 来 几 十 年 
中 会 运行 良好 。 本 书 中 所 有 代码 都 遵循 2011 ISO C++ 标准 。 

本 书面 向 三 类 读者 : 

e 想 知 道 最 新 的 ISO C++ 标准 都 提供 了 哪些 新 特性 的 C++ 程序 员 。 
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e 好 奇 C++ 到 底 提 供 了 哪些 超越 C 语言 的 特性 的 C 程序 员 。 
e 具备 Java、C#、Python 和 Ruby 等 编程 语言 背景 ， 正 在 探寻 “更 接近 机 器 ”的 语言 ， 
即 更 灵活 、 提 供 更 好 的 编译 时 检查 或 是 更 好 性 能 的 语言 的 程序 员 。 

自然 ， 这 三 类 读者 可 能 是 有 交集 的 个 专业 软件 开发 者 通常 掌握 多 门 编程 语言 。 

本 书 假 定 目 标 读者 是 程序 员 。 如 果 你 想 问 “ 什 么 是 for 循环 ?” 或 是 “什么 是 编译 器 ?”， 
那么 本 书 现在 还 不 适合 你 ， 我 向 你 推荐 我 的 另 一 本 书 《 C++ 程序 设计 原理 与 实践 》?， 这 
本 书 适合 作为 程序 设计 和 C++ 语言 的 人 门 书籍 。 而 且 ， 我 假定 读者 是 较为 成 熟 的 软件 开 
发 者 。 如 果 你 的 问题 是 “为 什么 要 费力 进行 测试 ?” 或 者 认为 “所 有 语言 基本 都 是 一 样 
的 ， 给 我 看 语法 就 可 以 了 ”， 甚 至 确信 存在 一 种 适合 所 有 任务 的 完美 语言 ， 那 么 本 书 也 不 适 
合 你 。 

相对 于 C++98，C++11 提出 了 哪些 改进 和 新 特性 呢 ? 适合 现代 计算 机 的 机 器 模型 会 涉 
及 大 量 并 发 处 理 。 为 此 ，C++11 提供 了 用 于 系统 级 并 行 编程 (如 使 用 多 核 ) 的 语言 和 标准 库 
特性 。C++11 还 提供 了 正则 表达 式 处 理 、 资 源 管理 指针 、 随 机 数 、 改 进 的 容器 (包括 哈 希 表 ) 
以 及 其 他 很 多 特性 。 此 外 ，C++11 还 提供 了 通用 和 一 致 的 初始 化 机 制 、 更 简单 的 for 语句、 
移动 语义 、 基 础 的 Unicode 支持 、lambda 表达 式 、 通 用 常量 表达 式 、 控 制 类 缺 省 定义 的 能 
力 、 可 变 参 数 模板 、 用 户 定义 的 字面 值 常 量 和 其 他 很 多 新 特性 。 请 记 住 ， 这 些 标准 库 和 语言 
特性 的 目标 就 是 支撑 那些 用 来 开发 高 质量 软件 的 程序 设计 技术 。 这 些 特性 应 该 组 合 使 用 一 一 
将 它们 看 作 盖 大 楼 的 砖 ， 而 不 应 该 相互 隔离 地 单独 使 用 来 解决 特定 问题 。 计 算 机 是 一 种 通用 
机 器 ， 而 C++ 在 其 中 起 着 重要 作用 。 特 别 是 ，C++ 的 设计 目标 就 是 足够 灵活 和 通用 ， 以 便 
处 理 那些 连 它 的 设计 者 都 未 曾 想象 过 的 未 来 难题 。 


除了 本 书 上 一 版 致谢 提 及 的 人 之 外 ， 我 还 要 感谢 Pete Becker、Hans-J. Boehm 、Marshall 
Clow、 Jonathan Coe、 Lawrence Crowl、 Walter Daugherty、 J. Daniel Garcia、 Robert Harle、 





Greg Hickman、 Howard Hinnant、 Brian Kernighan、 Daniel Kriigler、 Nevin Liber、 Michel 
Michaud 、Gary Powell 、Jan Christiaan van Winkel 和 Leor Zolman。 没 有 他 们 的 帮助 ， 本 书 
的 质量 要 差 得 多 。 

感谢 Howard Hinnant 为 我 解答 很 多 有 关 标 准 库 的 问题 。 

Andrew Sutton 是 Origin 库 的 作者 ， 模 板 相 关 章 节 中 很 多 模拟 概念 的 讨论 都 是 基于 这 个 
测试 平台 的 。 他 还 是 Matrix 库 的 作者 ， 这 是 第 29 章 的 主题 。Origin 库 是 开源 的 ， 在 互联 网 
上 搜索 “Origin” 和 “Andrew Sutton” 就 能 找到 。 

感谢 我 指导 的 毕业 设计 班 ， 他 们 从 第 一 部 分 中 找 出 的 问题 比 其 他 任何 人 都 多 。 

” 假如 我 能 遵照 审阅 人 的 所 有 建议 ， 毫 无 疑问 会 大 幅度 提高 本 书 的 质量 ， 但 篇 幅 上 也 会 增 
加 数 百 页 。 每 个 专家 审阅 人 都 建议 增加 技术 细节 、 进 阶 示例 和 很 多 有 用 的 开发 规范 ; 每 个 新 
手 审 阅 人 (或 教育 工作 者 ) 都 建议 增加 示例 ; 而 大 多 数 审 阅 人 都 (正确 地 ) 注意 到 本 书 的 篇 
幅 可 能 过 长 了 。 


名” 该 书 原文 影印 版 及 中 文 翻译 版 已 由 机 械 工 业 出 版 社 出 版 ， 书 号 分 别 为 ISBN 978-7-111-28248-8 和 ISBN 
978-7-111-30322-0。 一 一 编辑 注 
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感谢 普林斯顿 大 学 计算 机 科学 系 ， 特 别 感 谢 Brian Kernighan 教授 ， 在 我 利用 部 分 休假 
时 间 撰 写 此 书 时 给 予 我 热情 接待 。 | 

感谢 剑桥 大 学 计算 机 实验 室 ， 特 别 感谢 Andy Hopper 教授 ， 在 我 利用 部 分 休假 时 间 撰 写 
此 书 时 给 予 我 热情 接待 。 

感谢 编辑 Peter Gordon 以 及 他 在 Addison-Wesley 的 出 版 团队 ， 感 谢 你 们 的 帮助 和 耐心 。 


Bjarne Stroustrup 


于 得 克 萨 斯 大 学 城 


第 3 版 前 言 | 


The C++ Programming Language, Fourth Edition 


去 编程 就 是 去 理解 。 
Kristen Nygaard 





觉得 用 C++ 编程 比 以 往 更 令 人 愉快 。 在 过 去 这 些 年 里 ，C++ 在 支持 设计 和 编程 方面 
取得 了 令 人 振奋 的 进步 ， 针 对 其 使 用 的 大 量 新 技术 已 经 被 开发 出 来 了 。 然 而 ，C++ 并 不 只 是 
好 玩 。 普 通 的 程序 员 在 几乎 所 有 种 类 和 规模 的 开发 项 目 上 ， 在 生产 率 、 可 维护 性 、 灵 活性 和 
质量 方面 都 取得 了 显著 的 进步 。 到 今天 为 止 ，C++ 已 经 实现 了 我 当初 期 望 中 的 绝 大 部 分 ， 还 
在 许多 我 原来 根本 没有 梦想 过 的 工作 中 取得 了 成 功 。 

本 书 介绍 的 是 标准 C++ "以 及 由 C++ 所 支持 的 关键 编程 技术 和 设计 技术 。 与 本 书 第 1 
版 所 介绍 的 那个 C++ 版 本 相 比 ， 标 准 C++ 是 一 个 经 过 了 更 仔细 推荐 的 更 强大 的 语言 。 各 种 
新 的 语言 特征 ， 如 名 字 空 间 、 异 常 、 模 板 ， 以 及 运行 时 类 型 识别 ,使 人 能 以 比 过 去 更 直接 的 
方式 使 用 许多 技术 ， 标 准 库 使 程序 员 能 够 从 比 基 本 语言 高 得 多 的 层面 上 起 步 。 

本 书 第 2 版 中 大 约 有 三 分 之 一 的 内 容 来 自 第 1 版 。 第 3 版 则 重 写 了 更 大 的 篇 幅 。 它 提供 
的 许多 东西 是 大 部 分 有 经 验 的 程序 员 也 需要 的 ， 与 此 同时 ， 本 书 也 比 它 的 以 前 版 本 更 容易 让 
新 手 入 门 。C++ 使 用 的 爆炸 性 增长 和 由 此 带 来 的 海量 经 验 积累 使 这 些 成 为 可 能 。 

一 个 功能 广泛 的 标准 库 定 义 使 我 能 以 一 种 与 以 前 不 同 的 方式 介绍 C++ 的 各 种 概念 。 与 
过 去 一 样 ， 本 书 对 C++ 的 介绍 与 任何 特定 的 实现 都 没有 关系 ; 与 过 去 一 样 ， 教 材 式 的 各 章 
还 是 采用 “ 自 下 而 上 ”的 方式 ， 使 每 种 结构 都 是 在 定义 之 后 才 使 用 。 无 论 如 何 ， 使 用 一 个 设 
计 和 良好 的 库 远 比 理解 其 实现 细节 容易 得 多 。 因 此 ， 假 定 读者 在 理解 标准 库 的 内 部 工作 原理 之 
前 ， 就 可 以 利用 它 提供 许多 更 实际 、 更 有 趣 的 例子 。 标 准 库 本 身 也 是 程序 设计 示例 和 设计 技 
术 的 丰富 源泉 。 

本 书 将 介绍 每 种 主要 的 C++ 语言 特征 和 标准 库 ， 它 是 围绕 着 语言 和 库 功 能 组 织 起 来 的 。 
当然 ， 各 种 特征 都 将 在 使 用 它们 的 环境 中 介绍 。 也 就 是 说 ， 这 里 所 关注 的 是 将 语言 作为 一 种 
设计 和 编程 的 工具 ， 而 不 是 语言 本 身 。 本 书 将 展示 那些 使 C++ 卓有成效 的 关键 技术 ， 讲 述 
为 掌握 它们 所 需要 的 基本 概念 。 除 了 专门 阐释 技术 细节 的 那些 地 方 之 外 ， 其 他 示例 都 取 自 
系统 软件 领域 。 另 一 本 与 本 书 配套 出 版 的 书 《 带 标注 的 C++ 语言 标准 》( The Annotated C++ 
Language Standard)， 将 给 出 完整 的 语言 定义 ， 所 附 标注 能 使 它 更 容易 理解 。 

本 书 的 基本 目标 就 是 帮助 读者 理解 C++ 所 提供 的 功能 将 如 何 支 持 关键 的 程序 设计 技术 。 
这 里 的 目标 是 使 读者 能 远 远 超 越 简单 地 复制 示例 并 使 之 能 够 运行 ， 或 者 模仿 来 自 其 他 语言 的 
程序 设计 风格 。 只 有 对 隐藏 在 语言 背后 的 思想 有 了 很 好 的 理解 之 后 ， 才 能 真正 掌握 这 个 语 
言 。 如 果 有 一 些 具体 实现 的 文档 的 辅助 ， 这 里 所 提供 的 信息 就 足以 对 付 具 有 挑战 性 的 真实 世 
界 中 的 重要 项 目 。 我 的 希望 是 ， 本 书 能 帮助 读者 获得 新 的 洞察 力 ， 使 他 们 成 为 更 好 的 程序 员 
和 设计 师 。 
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致谢 

除了 第 1 版 和 第 2 版 的 致谢 中 所 提 到 的 那些 人 之 外 ， 我 还 要 感谢 Matt Austern 、Hans 
Boehm、 Don Caldwell 、Lawrence Crowl、 Alan Feuer、 Andrew Forrest、 David Gay、 Tim 
Griffin 、Peter Juhl、 Brian Kernighan、 Andrew Koenig、 Mike Mowbray、 Rob Murray、 Lee 
Nackman 、Joseph Newcomer、 Alex Stepanov、 David Vandevoorde 、Peter Weinberger 和 
Chris Van Wyk， 他 们 对 第 3 版 各 章 的 初稿 提出 了 许多 意见 。 没 有 他 们 的 帮助 和 建议 ， 这 本 
书 一 定 会 更 难 理解 ， 包 含 更 多 的 错误 ， 没 有 这 么 完整 ， 当 然 也 可 能 稍微 短 一 点 。 

我 还 要 感谢 C++ 标准 化 委员 会 的 志愿 者 们 ， 是 他 们 完成 了 规模 宏大 的 建设 性 工作 ， 才 
使 C++ 具有 它 今 天 这 个 样子 。 要 罗列 出 每 个 人 会 有 一 点 不 公平 ， 但 一 个 也 不 提 就 更 不 公平 ， 
所 以 我 想 特 别提 及 Mike Ball、Dag Briick、Sean Corfield 、Ted Goldstein 、Kim Knuttila、 
Andrew Koenig、 Dmitry Lenkov、 Nathan Myers、 Martin O’Riordan、Tom Plum、Jonathan 
Shopiro 、John Spicer、Jerry Schwarz、Alex Stepanov 和 Mike Vilot， 他 们 中 的 每 个 人 都 在 
C++ 及 其 标准 库 的 某 些 方面 直接 与 我 合作 过 。 

在 这 本 书 第 一 次 印刷 之 后 ， 许 多 人 给 我 发 来 电子 邮件 ， 提 出 更 正和 建议 。 我 已 经 在 本 
书 的 结构 中 响应 了 他 们 的 建议 ， 使 后 来 出 版 的 版 本 大 为 改善 。 将 本 书 翻译 到 各 种 语言 的 译 者 
也 提供 了 许多 澄清 性 的 意见 。 作 为 对 这 些 读 者 的 回应 ， 我 增加 了 附录 D 和 附录 卫 。 让 我 借 
这 个 机 会 感谢 他 们 之 中 特别 有 帮助 的 几 位 : Dave Abrahams、Matt Austern 、Jan Bielawski、 
Janina Mincer Daszkiewicz、Andrew Koenig、 Dietmar Kiihl、 Nicolai Josuttis 、Nathan 
Myers 、Paul E. Sevin¢、 Andy Tenne-Sens 、Shoichi Uchida、 Ping-Fai ( Mike) Yang 和 Dennis 
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Bjarne Stroustrup 


于 新 泽 西 默 里 山 


第 2 版 前 言 | 


The C++ Programming Language, Fourth Edition 


前 路 漫漫 。 
一 一 Bilbo Baggins 


正如 在 本 书 的 第 1 版 中 所 承诺 的 ，C++ 为 满足 其 用 户 的 需要 正在 不 断 地 演化 。 这 一 
演化 过 程 得 益 于 许多 有 着 极 大 的 背景 差异 ， 在 范围 广泛 的 应 用 领域 中 工作 的 用 户 们 的 实际 
经 验 的 指导 。 在 第 1 版 出 版 后 的 六 年 中 ，C++ 的 用 户 群 体 扩 大 了 不 止 百 倍 ， 人 们 学 到 了 
许多 东西 ， 发 现 了 许多 新 技术 并 通过 了 实践 的 检验 。 这 些 技 术 中 的 一 些 也 在 这 一 版 中 有 所 
反映 。 

在 过 去 六 年 里 所 完成 的 许多 语言 扩展 ， 其 基本 宗旨 就 是 将 C++ 提升 为 一 种 服务 于 一 般 
性 的 数据 抽象 和 面向 对 象 程序 设计 的 语言 ， 特 别 是 提升 为 一 个 可 编写 高 质量 的 用 户 定义 类 型 
库 的 工具 。 一 个 “高 质量 的 库 ” 是 指 这 样 的 库 ， 它 以 一 个 或 几 个 方便 、 安 全 且 高 效 的 类 的 形 
式 ， 给 用 户 提供 了 一 个 概念 。 在 这 个 环境 中 ， 安 全 意味 着 这 个 类 在 库 的 使 用 者 与 它 的 供 方 之 
间 构 成 了 一 个 特殊 的 类 型 安全 的 界面 ; 高 效 意 味 着 与 手工 写 出 的 C 代码 相 比 ， 这 种 库 的 使 用 
不 会 给 用 户 强加 明显 的 运行 时 间 上 或 空间 上 的 额外 开销 。 

本 书 介绍 的 是 完整 的 C++ 语言 。 从 第 1 章 到 第 10 章 是 一 个 教材 式 的 导 引 ， 第 11 章 到 
第 13 章 展现 的 是 一 个 有 关 设 计 和 软件 开发 问题 的 讨论 ， 最 后 包含 了 完整 的 C++ 参考 手册 。 
自然 ， 在 原来 版 本 之 后 新 加 入 的 特征 和 变化 已 成 为 这 个 展示 的 有 机 组 成 部 分 。 这 些 特征 包 
括 : 经 过 精 化 后 的 重 载 解析 规则 和 存储 管理 功能 ， 以 及 访问 控制 机 制 、 类 型 安全 的 连接 、 
const 和 static 成 员 函 数 、 抽 象 类 、 多 重 继承 、 模 板 和 异常 处 理 。 

C++ 是 一 个 通用 的 程序 设计 语言 ， 其 核心 应 用 领域 是 最 广泛 意义 上 的 系统 程序 设计 。 
此 外 ，C++ 还 被 成 功 地 用 到 许多 无 法 称 为 系统 程序 设计 的 应 用 领域 中 。 从 最 摩登 的 小 型 计算 
机 到 最 大 的 超级 计算 机 上 ， 以 及 几乎 所 有 操作 系统 上 都 有 C++ 的 实现 。 因 此 ， 本 书 描述 的 
是 C++ 语言 本 身 ， 并 不 想 试 着 去 解释 任何 特殊 的 实现 、 程 序 设计 环境 或 者 库 。 

本 书 中 给 出 的 许多 类 的 示例 虽然 都 很 用， 但 也 还 是 应 该 归 到 “玩具 ”一 类 。 与 在 完整 
的 精益 求 精 的 程序 中 做 解释 相 比 ， 这 里 所 采用 的 解说 风格 能 更 清晰 地 呈现 那些 具有 普遍 意义 
的 原理 和 极其 有 用 的 技术 ， 在 实际 例子 中 它们 很 容易 被 细节 所 淹没 。 这 里 给 出 的 大 部 分 有 用 
的 类 ， 如 链接 表 、 数 组 、 字 符 串 、 和 矩阵 、 图 形 类 、 关 联 数组 等 ， 在 广泛 可 用 的 各 种 商品 和 非 
商品 资源 中 ， 都 有 可 用 的 “防弹 ”或 “ 金 盘 ” 版 本 。 那 些 “ 具 有 工业 强度 ”的 类 和 库 中 的 许 
多 东西 ， 实 际 上 不 过 是 在 这 里 可 以 找到 的 玩具 版 本 的 直接 或 间接 后 裔 。 

与 第 1 版 相 比 ， 这 一 版 更 加 强调 本 书 在 教学 方面 的 作用 。 然 而 ， 这 里 的 叙述 仍然 是 针 
对 有 经 验 的 程序 员 ， 并 努力 不 去 轻视 他 们 的 智慧 和 经 验 。 有 关 设 计 问 题 的 讨论 有 了 很 大 的 扩 
充 ， 作 为 对 读者 在 语言 特征 及 其 直接 应 用 之 外 的 要 求 的 一 种 回应 。 技 术 细节 和 精确 性 也 有 所 
增强 。 特 别 是 ， 这 里 的 参考 手册 体现 了 在 这 个 方向 上 多 年 的 工作 。 我 的 目标 是 提供 一 本 具有 
足够 深度 的 书籍 ， 使 大 部 分 程序 员 能 在 多 次 阅读 中 都 有 所 收获 。 换 句 话 说 ， 这 本 书 给 出 的 是 
C++ 语言 ， 它 的 基本 原理 ， 以 及 使 用 时 所 需要 的 关键 性 技术 。 欢 迎 欣 赏 ! 
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第 1 版 前 言 | 


The C++ Programming Language, Fourth Edition 


语言 磨 三 了 我 们 思维 的 方式 ， 
也 决定 着 我 们 思考 的 范围 。 
一 一 B.L. Whorf 


C++ 是 一 种 通用 的 程序 设计 语言 ， 其 设计 就 是 为 了 使 认真 的 程序 员工 作 得 更 愉快 。 除 
了 一 些小 细节 之 外 ，C++ 是 C 程序 设计 语言 的 一 个 超 集 。C++ 提供 了 C 所 提供 的 各 种 功能 ， 
还 为 定义 新 类 型 提供 了 灵活 而 有 效 的 功能 。 程 序 员 可 以 通过 定义 新 类 型 ， 使 这 些 类 型 与 应 用 
中 的 概念 紧密 对 应 ， 从 而 把 一 个 应 用 划分 成 许多 容易 管理 的 片段 。 这 种 程序 构造 技术 通常 被 
称 为 数据 抽象 。 某 些 用 户 定义 类 型 的 对 象 包含 着 类 型 信息 ， 这 种 对 象 就 可 以 方便 而 安全 地 
用 在 那 种 对 象 类 型 无 法 在 编译 时 确定 的 环境 中 。 使 用 这 种 类 型 的 对 象 的 程序 通常 被 称 为 是 
基于 对 象 的 。 如 果 用 得 好 ， 这 些 技术 可 以 产生 出 更 短 、 更 容易 理解 ， 而 且 也 更 容易 管理 的 
程序 。 

C++ 里 的 最 关键 概念 是 类 。 一 个 类 就 是 一 个 用 户 定义 类 型 。 类 提供 了 对 数据 的 隐藏 ， 
数据 的 初始 化 保证 ， 用 户 定义 类 型 的 隐 式 类 型 转换 ,动态 类 型 识别 ， 用 户 控 制 的 存储 管理 ， 
以 及 重 载运 算 符 的 机 制 等 。 在 类 型 检查 和 表述 模块 性 方面 ，C++ 提供 了 比 C 好 得 多 的 功能 。 
它 还 包含 了 许多 并 不 直接 与 类 相关 的 改进 ， 包 括 符号 常量 、 函 数 的 在 线 替换 、 默 认 函 数 参 
数 、 重 载 函 数 名 、 自 由 存储 管理 运算 符 ， 以 及 引用 类 型 等 。C++ 保持 了 C 高 效 处 理 硬件 基 
本 对 象 (位 、 字 节 、 字 、 地 址 等 ) 的 能 力 。 这 就 使 用 户 定义 类 型 能 够 在 相当 高 的 效率 水 平 上 
实现 。 

C++ 及 其 标准 库 也 是 为 了 可 移植 性 而 设计 的 。 当 前 的 实现 能 够 在 大 多 数 支 持 C 的 系统 
上 运行 。C 的 库 也 能 用 于 C++ 程序 ， 而 且 大 部 分 支持 C 程序 设计 的 工具 也 同样 能 用 于 C++。 

本 书 的 基本 目标 就 是 帮助 认真 的 程序 员 学 习 这 个 语言 ， 并 将 它 用 于 那些 非 平凡 的 项 目 。 
书 中 提供 了 有 关 C++ 的 完整 描述 ， 许 多 完整 的 例子 ， 以 及 更 多 的 程序 片段 。 
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本 部 分 介绍 C++ 标准 库 。 目 标 是 让 读者 理解 如 何 使 用 标准 库 ， 展 示 
通用 的 设计 和 编程 技术 ， 并 展示 如 何 按 标准 库 的 本 来 设计 意图 扩展 它 。 


tira 我 才 发 现 把 一 个 人 的 思想 表达 为 文字 有 多 么 困难 。 如 果 仅 仅 是 
一 些 氢 述 倒 还 容易 ; 但 当 涉 及 推理 论证 时 ， 要 建立 起 恰当 的 联系 、 形 成 
清晰 流畅 的 文字 ， 就 像 我 说 过 的 ， 对 我 来 说 很 困难 ， 没 有 头绪 …… 


一 一 查尔斯 达尔 文 。 


加 摘自 查尔斯 ' 达尔 文 1836 年 4 月 29 日 写 给 他 姐姐 卡 罗 琳 的 信 ， 当 时 他 正在 整理 前 人 的 一 些 地 质 学 笔记 


(几乎 是 重 写 )。 
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艺术 和 自然 的 许多 奥秘 常 被 胸 无 点 墨 之 人 认为 是 魔法 。 


e 引言 

标准 库 设 施 ; 设计 约束 ; 描述 风格 
e 头 文件 
e 语言 支持 

initializer_list 支持 ; 范围 for 支持 
e 错误 处 理 

异常 ; 断言 ; system_error 
e 建议 


30.1 引言 


标准 库 是 一 个 组 件 集合 ,在 ISO C++ 标准 中 定义 ,在 所 有 C++ 实现 中 都 以 一 致 的 形式 
(和 性 能 ) 提供 。 出 于 可 移植 性 和 长 期 维护 的 考虑 ， 我 强烈 推荐 在 适合 的 地 方 尽量 使 用 标准 
库 。 也 许 你 有 能 力 设 计 并 实现 一 个 更 好 的 库 蔡 代 标准 库 用 于 你 的 程序 之 中 , 但 : 

e 未 来 代码 的 维护 者 学 习 你 的 版 本 的 设计 是 否 容 易 ? 

e 你 的 版 本 有 多 大 可 能 性 适用 于 10 年 之 后 的 一 个 新 平台 ? 

e 你 的 版 本 有 多 大 可 能 性 适用 于 未 来 的 应 用 ? 

e 你 的 版 本 有 多 大 可 能 性 能 与 用 标准 库 编写 的 代码 互 操作 ? 

e 你 投入 到 优化 和 测试 中 的 精力 有 多 大 可 能 性 能 与 设计 和 实现 标准 库 的 投入 相提并论 ? 
而 且 ， 如 果 你 使 用 了 自己 设计 的 版 本 ， 那 么 你 (或 你 所 属 单位 ) 自然 就 要 “永远 ”负责 它 的 
维护 和 演化 。 一 般 而 言 : 不 要 尝试 重新 发 明 轮子 。 

标准 库 相 当 庞 大 : 在 ISO C++ 标准 中 ， 标 准 库 相 关 部 分 厚 达 785 页 。 而 且 这 还 不 包 
括 描 述 ISO C 标准 库 的 部 分 ( 另 有 139 页 )， 这 其 实 也 是 C++ 标准 库 的 一 部 分 。 与 之 相 比 ， 
C++ 语言 规范 仅 有 398 页 。 在 本 章 中 ， 我 将 概述 标准 库 的 主要 内 容 ， 主 要 是 以 表格 的 方式 提 
供 ， 辅 以 少量 示例 。 读 者 可 从 其 他 地 方 查阅 更 详细 的 内 容 ， 包 括 ISO C++ 标准 的 网 上 副本 、 
C++ 实现 的 完整 在 线 文档 以 及 (如 果 你 愿意 读 代 码 的 话 ) 开源 实现 ， 请 查阅 这 些 C++ 标准 的 
文献 来 获得 全 部 细节 。 

标准 库 相 关 章 节 的 编排 并 不 是 为 了 让 读者 按 顺 序 阅读 ， 每 一 章 以 及 每 个 重要 的 小 节 通 常 
都 是 可 以 独立 阅读 的 。 如 果 你 遇 到 一 些 不 了 解 的 内 容 ， 请 通过 交叉 引用 查阅 相关 章节 。 


30.1.1 标准 库 设 施 
哪些 组 件 应 该 放 在 标准 C++ 库 中 ? 对 于 一 个 程序 员 而 言 ， 最 理想 的 情况 当然 是 能 在 库 
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中 找到 所 有 感 兴趣 的 、 重 要 的 且 有 很 好 通用 性 的 类 、 函 数 、 模 板 ， 等 等 。 但 是 ， 这 里 的 问题 
不 是 “什么 应 该 放 在 某 个 库 中 ? ”而 是 “什么 应 该 放 在 标准 库 中 ?”“ 所 有 东西 !1” 对 前 一 个 
问题 而 言 是 接近 答案 的 恰当 的 第 一 步 ， 但 对 后 一 个 问题 而 言 并 不 是 这 样 。 标 准 库 是 所 有 C++ 
实现 都 必须 提供 的 ， 以 便 每 个 程序 员 都 能 依靠 它 来 编写 程序 。 
C++ 标准 库 提供 : 
e 语言 特性 的 支持 ， 例 如 内 存 管理 ( 见 11.2 节 )、 范 围 for 语句 ( 见 9.5.1 节 ) 和 运行 时 
类 型 信息 ( 见 22.2 节 ); 
e 具体 C++ 实现 所 定义 的 一 些 语言 相关 的 信息 ， 如 最 大 float 值 ( 见 40.2 节 ); 
e 单纯 用 语言 难以 高 效 实现 的 基本 操作 ， 例 如 is_polymorphic、is_scalar 和 is_ 
nothrow_constructible ( 见 35.4.1 节 ); 
e 底层 (“无 锁 ”) 并 发 编程 设施 ( 见 41.3 节 ); 
e 基于 线程 的 并 发 编程 的 支持 ( 见 5.3 节 和 42.2 节 ); 
。 基于 任务 的 并 发 的 基本 支持 ， 例 如 future 和 async() ( 见 42.4 节 ); 
e 大 多 数 程序 员 难 以 实现 最 优 且 可 移植 版 本 的 函数 ， 如 uninitialized_fill() ( 见 32.5 节 ) 
和 memmove()( 见 43.5 节 ); 
e (可 选 的 ) 无 用 内 存 回 收 (垃圾 收集 ) 的 基本 支持 ， 如 declare_reachable() ( 见 34.5 节 ); 
e 程序 员 编写 可 移植 代码 所 需 的 复杂 基础 组 件 ， 如 list( 见 31.4 节 ).map( 见 31.4.3 节 )、 
sort() ( 见 32.6 节 ) 和 IO 流 ( 见 第 38 章 ); 
e 用 于 标准 库 自 身 扩 展 的 框架 ， 如 允许 用 户 为 自 定 义 类 型 提供 与 内 置 类 型 相似 的 IO 操 
作 的 规范 和 基础 组 件 ( 见 第 38 章 ) 以 及 标准 模板 库 STL ( 见 第 31 章 )。 
有 一 些 特性 被 纳入 标准 库 是 因为 符合 惯例 且 很 有 用 ， 例 如 sqrt() 等 标准 数学 函数 ( 见 40.3 
节 )、 随 机 数 发 生 器 ( 见 40.7 节 ) complex 算术 运算 〈 见 40.4 节 ) 和 正则 表达 式 ( 见 第 37 章 )。 
标准 库 的 设计 目标 之 一 是 成 为 其 他 库 的 公共 基础 。 特 别 是 ， 组 合 使 用 标准 库 特 性 可 以 起 
到 三 方面 的 支撑 作用 : 
e 可 移植 性 的 基础 ; 
e 一 组 紧凑 且 高 效 的 组 件 ， 可 以 作为 构造 性 能 敏感 的 库 和 应 用 的 基础 ; 
e 一 组 实现 库 内 交互 的 组 件 。 
标准 库 的 设计 主要 由 这 三 方面 作用 确定 ， 而 这 三 方面 也 是 紧密 相关 的 。 例 如 ， 对 一 个 专 
用 的 程序 库 而 言 ， 可 移植 性 通常 是 一 个 重要 的 设计 准则 ， 而 链表 和 映射 这 种 通用 容器 类 型 对 
独立 开发 的 库 之 间 进 行 便利 交互 是 非常 重要 的 。 
从 设计 角度 来 说 ， 最 后 一 个 作用 特别 重要 ， 因 为 它 有 助 于 限制 标准 库 的 范围 以 及 对 标 
准 库 组 件 设置 约束 。 例 如 ， 标 准 库 提供 了 字符 串 和 和 链表。 如 果 不 提 供 这 两 种 设施 的 话 ， 独 立 
开发 的 库 之 间 可 能 只 能 用 内 置 类 型 来 交互 。 但 是 ， 标 准 库 并 未 提供 高 级 线性 代数 和 图 形 化 组 
件 。 这 些 组 件 显然 应 用 广泛 ,但 独立 开发 的 库 之 间 很 少 直接 利用 它们 进行 交互 。 
对 某 个 组 件 而 言 ， 除 非 它 是 支持 这 些 目 标 所 必需 的 ， 否 则 我 们 就 应 将 其 置 于 其 他 库 而 不 
是 标准 库 中 。 将 某 个 组 件 排除 在 标准 库 之 外 为 多 个 库 竞 相 实 现 同一 个 思想 打开 了 大 门 ， 这 有 
好 的 一 面 也 有 不 好 的 一 面 。 一 旦 一 个 库 证 明 它 能 广泛 适用 于 不 同 计算 环境 和 应 用 领域 ， 它 就 
会 成 为 标准 库 的 候选 ， 正 则 表达 式 库 ( 见 第 37 章 ) 就 是 这 样 一 个 例子 。 
精简 的 标准 库 非 常 适合 于 独立 实现 ， 即 对 操作 系统 运行 支持 有 最 小 依赖 甚至 不 依赖 的 实 
现 ( 见 6.1.1 节 )。 
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30.1.2 设计 约束 


标准 库 的 作用 对 其 设计 施加 了 一 些 约束 。C++ 标准 库 设 施 的 设计 应 满足 : 

对 所 有 学 生 和 专业 程序 员 (包括 其 他 库 的 设计 者 ) 都 是 有 价值 且 代 价 可 承受 的 。 

能 被 所 有 程序 员 直 接 或 间接 用 于 所 有 事情 (限于 库 的 范围 内 )。 

足够 高 效 ， 能 在 实现 其 他 库 时 真正 替代 手工 编写 的 函数 、 类 和 模板 。 

不 需要 策略 ， 或 者 可 以 选择 将 策略 以 参数 形式 提供 。 

从 数学 角度 看 是 本 原 的 。 即 ， 对 两 个 弱 相 关 的 角色 ， 一 个 组 件 承 担 两 个 角色 比 两 个 
组 件 分 别 独 立 承担 单一 角色 几乎 必然 有 更 多 开销 。 

对 常见 用 途 而 言 是 便利 、 高 效 且 相当 安全 的 。 

就 它们 所 做 之 事 而 言 是 完备 的 。 标 准 库 可 能 将 一 些 重 要 功能 留 给 其 他 库 实现 , 但 只 
要 它 承担 了 某 个 任务 ， 就 必须 提供 足够 的 功能 ,使 得 个 人 用 户 或 库 实现 者 不 必 和 替换 
它 就 能 完成 基本 工作 。 

内 置 类 型 和 运算 简单 易 用 。 

默认 是 类 型 安全 的 ， 因 而 原则 上 可 进行 运行 时 检查 。 

支持 已 被 普遍 接受 的 编程 风格 。 

可 被 扩展 以 处 理 用 户 自 定 义 类 型 ， 且 处 理 方式 与 内 置 类 型 和 标准 库 类 型 类 似 。 

例如 ， 将 比较 标准 置 于 排序 函数 内 是 不 可 接受 的 ， 因 为 相同 的 数据 可 能 按 不 同 的 标准 来 排 
序 。 这 也 是 C 标准 库 中 的 qsort() 接受 一 个 比较 函数 作为 参数 ， 而 不 是 依赖 某 个 特定 的 比较 
运算 符 (如 <， 见 12.5 节 ) 的 原因 。 另 一 方面 ， 每 次 比较 操作 都 带 来 一 次 函数 调用 的 额外 开 
销 ， 这 是 对 性 能 和 通用 性 的 折衷 ， 这 令 qsort() 能 成 为 构建 其 他 库 的 基石 。 对 几乎 所 有 数据 
类 型 ， 都 可 以 很 容易 地 实现 没有 额外 函数 调用 开销 的 比较 操作 。 

这 个 额外 开销 是 否 严重 ? 在 大 多 数 情况 下 ， 可 能 并 不 严重 。 但 是 ， 对 某 些 算法 ， 函 数 调 
用 开销 可 能 占据 大 部 分 运行 时 间 ， 从 而 促使 用 户 寻求 替代 方案 。25.2.3 节 中 介绍 的 技术 通过 
模板 实 参 提 供 比较 标准 ， 从 而 为 sort() 和 很 多 其 他 标准 库 算法 解决 了 这 个 问题 。 排 序 的 例子 
展示 了 性 能 和 通用 性 间 的 角力 ， 也 展示 了 解决 方法 。 标 准 库 不 仅 要 完成 其 任务 ， 还 要 高 效 地 
完成 ,不致 让 用 户 忍 不 住 设计 自己 的 版 本 来 替换 标准 库 组 件 。 否 则 ， 高 级 特性 的 实现 者 为 了 
保持 竞争 力 就 不 得 不 绕 过 标准 库 。 这 无 疑 会 增加 库 设 计 者 的 负担 ， 对 于 希望 坚持 平台 无 关 性 
或 使 用 多 个 独立 库 的 用 户 ， 也 会 增加 其 工作 的 复杂 性 。 

“本 原 性 ”和 “常见 应 用 便利 性 ”这 两 个 要 求 可 能 会 有 冲突 。 前 一 个 要 求 排除 了 针对 
常见 用 途 优化 标准 库 的 可 能 性 。 但 是 ， 我 们 应 该 允许 针对 常见 应 用 的 非 本 原 组 件 作 为 本 原 
组 件 的 补充 纳入 到 标准 库 中 ， 而 不 是 蔡 代 后 者 。 对 正 交 性 的 迷信 不 应 妨碍 我 们 让 初学 者 和 
普通 用 户 的 工作 变 得 更 加 方便 ， 也 不 应 导致 我 们 设计 出 一 些 具有 上 涩 危险 的 默认 行为 的 
组 件 。 


30.1.3 ”描述 风格 


即便 是 一 个 简单 的 标准 库 操作 ， 例 如 一 个 构造 函数 或 一 个 算法 ， 其 完整 描述 可 能 也 会 
花费 好 几 页 。 因 此 ， 我 使 用 一 种 极其 精简 的 描述 风格 ,通常 在 一 个 表格 中 描述 若干 相关 的 
操作 。 
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一 组 操作 
p=op(b,e,x) 操作 op 对 范围 [b:e) 中 的 元 素 和 x 执行 某 种 操作 ,返回 p 
foo(x) foo 对 x 执行 某 种 操作 但 不 返回 结果 
bar(b,e,x) x 要 对 范围 [b:e) 中 的 元 素 执行 某 种 操作 ? 


我 尽量 选择 有 助 记忆 的 标识 符 : b 和 e 是 指出 一 个 范围 的 迭代 器 ，p 是 一 个 指针 或 一 个 迭代 
器 ，x 是 某 个 值 ， 这 都 依赖 于 程序 上 下 文 。 对 于 这 种 符号 表示 ， 你 只 能 借助 第 二 栏 的 说 明 来 
区 分 无 返回 结果 和 返回 布尔 结果 ， 因 此 如 果 仔 细 思 考 的 话 你 可 能 会 对 此 感到 困惑 。 对 一 个 返 
回 布尔 值 的 操作 来 说 ， 其 说 明 通常 以 问号 结束 。 算 法 会 遵循 常用 模式 : 返回 输入 序列 尾 来 表 
示 “ 失 败 ”"“ 未 找到 ”等 结果 ( 见 4.5.1 节 和 33.1.1. 节 )， 对 于 这 些 我 不 再 具体 说 明 。 

通常 ， 在 这 种 简要 描述 之 后 都 会 附 上 对 ISO C++ 标准 相关 内 容 的 一 些 进一步 的 解释 以 
及 实例 的 引用 。 


30.2 ” 头 文件 


标准 库 组 件 都 定义 在 命名 空间 std 中 ， 以 一 组 头 文件 的 形式 提供 。 头 文件 构成 了 标准 库 
最 主要 的 部 分 ， 因 此 ， 列 出 头 文件 可 以 给 出 标准 库 的 一 个 概貌 。 

本 节 剩 余部 分 按 功能 分 组 列 出 标准 库 头 文件 ， 每 个 头 文件 都 给 出 简要 说 明 并 列 出 详细 讨 
论 它 的 章节 编号 。 分 组 是 依据 标准 库 自 身 的 组 织 结构 来 划分 的 。 

以 字母 c 开 头 的 标准 库 头 文件 对 应 C 标准 库 中 的 头 文件 。 每 个 C 标准 库 头 文件 <X.h> 
都 定义 了 一 些 同 时 位 于 全 局 命名 空间 和 命名 空间 std 中 的 内 容 ， 且 有 一 个 定义 相同 内 容 的 
对 应 头 文件 <cX>。 理 想 情 况 下 ， 头 文件 <cX> 中 的 名 字 不 会 污染 全 局 命名 空间 ( 见 15.2.4 
节 ), 但 不 幸 的 是 ( 归 短 于 管理 多 语言 、 多 操作 系统 环境 的 复杂 性 ) 大 多 数 实际 情况 下 会 发 生 


容器 
<vector> 可 变 大 小 一 维 数组 31.4.2 节 
<deque> 双 端 队列 31.4.2 节 
<forward list> 单 向 链表 31.4.2 节 
<list> 双向 链表 31.4.2 节 
<map> 关联 数组 31.4.3 节 
<set> 集合 31.4.3 节 
<unordered_map> 哈 希 关联 数组 31.4.3.2 节 
<unordered_set> 哈 希 集合 31.4.3.2 节 
<queue> 队列 31.5.2 节 
<stack> 栈 31.5.1 节 
<array> 固定 大 小 一 维 数组 34.2.1 节 
<bitset> bool 数组 34.21 节 


关联 容器 multimap 和 multiset 分 别 声明 在 <map> 和 <set> 中 ,priority_queue( 见 31.5.3 节 ) 
声明 在 <queue> 中 。 
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通用 工具 
<utility> 运算 符 和 值 对 35.5 节 、34.2.4.1 节 
<tuple> 元 组 34.2.4.2 节 
<type_traits> 类 型 荃 取 35.4.1 节 
<typeindex> 将 type_info 用 作 一 个 关键 字 或 哈 希 码 35.5.4 节 
<functional> 也 数 对 象 33.4 节 
<memory> 资源 管理 指针 34.3 节 
<scoped_allocator> 限定 作用 域 的 分 配器 34.4.4 节 
<ratio> 编译 时 有 理 数 算术 运算 35.3 节 
<chrono> 时 间 工 具 35.2 节 
<ctime> C 风格 日 期 和 时 间 工 具 43.6 节 
<iterator> 迭代 器 及 其 支持 33.1 节 
迭代 器 机 制 令 标 准 库 算 法 具有 通用 性 ( 见 3.4.2 节 和 33.1.4 节 )。 
算法 
<algorithm> 泛 型 算法 32.2 节 
<cstdlib> bsearch()、qsort() 43.7 节 


一 个 典型 的 泛 型 算法 能 应 用 于 任何 类 型 的 元 素 构成 的 序列 ( 见 3.4.2 节 和 32.2 节 )。C 标准 库 
函数 bsearch() 和 qsort() 只 能 用 于 内 置 数组 ， 且 元 素 类 型 不 能 有 用 户 自 定义 的 拷贝 构造 函 
数 和 析 构 函数 ( 见 12.5 节 )。 





诊断 
<exception> 异常 类 30.4.1.1 节 
<stdexcept> 标准 异常 30.4.1.1 节 
<cassert> 断言 宏 30.4.2 节 
<cerrno> C 风格 错误 处 理 13.1.2 节 
<system_error> 系统 错误 支持 30.4.3 节 
使 用 异常 的 断言 在 13.4 节 中 描述 过 。 
字符 串 和 字符 
<string> T 的 字符 串 第 36 章 
<cctype> 字符 分 类 36.2.1 节 
<cwctype> 宽 字 符 分 类 36.2.1 节 
<cstring> C 风格 字符 串 函 数 43.4 节 
<cwchar> C 风格 宽 字 符 字 符 串 函数 36.2.1 节 
<cstdlib> C 风格 分 配 函 数 43.5 节 
<cuchar> C 风格 多 字 节 字符 串 
<regex> 正则 表达 式 匹 配 第 37 章 


头 文件 <cstring> 声明 了 strlen() 、strcpy() 等 一 族 函 数 。 头 文件 <cstdlib> 声明 了 atof() 和 
atoi()， 可 将 C 风格 字符 串 转换 为 数值 。 
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输入 / 输出 

<iosfwd> IO 组 件 的 前 置 声明 38.1 节 
<iostream> 标准 iostream 对 象 和 操作 38.1 节 
<ios> iostream 基 类 38.4.4 节 
<streambuf> 流 缓冲 38.6 节 
<istream> 输入 流 模板 38.4.1 节 
<ostream> 输出 流 模板 38.4.2 节 
<iomanip> 操纵 符 38.4.5.2 节 
<sstream> 字符 串 流 38.2.2 节 
<cctype> 字符 分 类 函数 36.2.1 节 
<fstream> 文件 流 38.2.1 节 
<cstdio> printf()UO 函数 族 43.3 节 
<cwchar> 宽 字符 printf() 风格 IO 函数 43.3 节 


操纵 符 是 操作 流 状态 的 对 象 ( 见 38.4.5.2 节 )。 





本 地 化 
<locale> 表示 文化 差异 第 39 章 
<clocale> 文化 差异 C 风格 表示 
<codecvt> 代码 转换 39.4.6 节 


locale 对 日 期 输出 格式 、 货 币 表示 符号 和 字符 串 校勘 等 在 不 同 语言 和 文化 中 有 差异 的 内 容 进 
行 本 地 化 。 


语言 支持 
<limits> 数值 限制 40.2 节 
<climits> 数值 标量 限制 C 风格 宏 40.2 节 
<cfloat> 浮 点 数 限制 C 风格 宏 40.2 节 
<cstdint> 标准 整数 类 型 名 43.7 节 
<new> 动态 内 存 管理 11.2.3 节 
<typeinfo> 运行 时 类 型 识别 支持 22.5 节 
<exception> 异常 处 理 支 持 30.4.1.1. 节 
<initializer_list> initializer_list 30.3.1 节 
<cstddef> C 标准 库 语 言 支持 10.3.1 节 
<cstdarg> 可 变 长 度 函 数 参 数列 表 12.2.4 节 
<Csetjimp> C 风格 栈 展 开 
<cstdlib> 程序 终止 15.4.3 节 
<ctime> 系统 时 钟 43.6 节 
<csignal> C 风格 信号 处 理 


头 文件 <cstddef> 定义 了 sizeof() 返回 的 类 型 size_t、 指 针 减 法 和 数组 下 标 返 回 的 类 型 
ptrdiff_t ( 见 10.3.1 节 ) 以 及 声名 狼藉 的 NULL 宏 ( 见 7.2.2 节 )。 

C 风格 栈 展开 (使 用 <csetimp> 中 的 setjmp 和 longjmp) 与 析 构 函数 和 异常 处 理 不 兼 
容 ( 见 第 13 章 和 30.4 节 )， 因 此 最 好 避免 使 用 。 本 书 不 会 讨论 C 风格 栈 展开 和 信号 机 制 。 
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数值 
<complex> 复数 及 其 运算 40.4 节 
<valarray> 数值 向 量 及 其 运算 40.5 节 
<numeric> 推广 的 数值 运算 40.6 节 
<cmath> 标准 数学 函数 40.3 节 
<cstdlib> C 风格 随机 数 40.7 节 
<random> 随机 数 发 生 器 40.7 节 


由 于 历史 原因 ，abs() 和 div() 不 像 其 他 数学 函数 那样 在 <cmath> 中 ( 见 40.3 节 )， 而 是 在 
<cstdlib> 中 。 


并 发 
<atomic> 原子 类 型 及 其 操作 41.3 节 
<condition_variable> 等 待 动 作 42.3.4 节 
<future> 异步 任务 42.4.4 节 
<mutex> 互 斥 类 42.3.1 节 
<thread> 线程 2 


C 标准 库 的 一 些 组 件 与 C++ 程序 员 有 着 不 同 程度 的 关联 ，C++ 标准 库 提 供 了 对 这 些 组 件 的 
访问 机 制 。 





C 兼容 性 
<cinttypes> 公共 整数 类 型 的 别名 43.7 节 
<cstdbool> C 的 bool 类 型 
<ccomplex> <complex> 
<cfenv> 浮 点 数 环境 
<cstdalign> C 的 对 齐 机 制 
<ctgmath> C 的 “ 泛 型 数学 函数 ”: <complex> 和 <cmath> 


头 文件 <cstdbool> 没有 定义 bool、true 或 false 等 宏 。 头 文件 <cstdalign> 没有 定义 宏 
alignas。<cstdbool>、<ccomplex> 、<cstdalign> 和 <ctgmath> 对 应 的 .h 版 本 大 致 相当 于 
C++ 组 件 的 C 版 本 ， 应 尽量 避免 使 用 它们 。 

头 文件 <cfenv> 提供 了 一 些 类 型 (例如 fenv_ t 和 fexcept_t)、 浮 点 状态 标志 以 及 控制 模 
式 ， 用 来 描述 C++ 实现 的 浮 点 环境 。 

用 户 或 库 的 实现 者 并 不 允许 向 标准 库 头 文件 中 增加 声明 或 是 减少 声明 。 试 图 通过 定义 宏 
来 改变 头 文件 中 声明 的 含义 ， 从 而 改变 头 文件 内 容 也 是 不 允许 的 ( 见 15.2.3 节 )。 任 何 玩 这 
种 把 戏 的 程序 或 实现 都 不 符合 标准 ， 依 赖 于 这 种 花招 的 程序 也 都 是 不 可 移植 的 。 即 使 这 些 程 
序 今天 能 正常 运行 ， 未 来 C++ 库 实现 的 任何 部 分 的 更 新 都 可 能 令 它 们 崩 演 。 因 此 ， 应 避免 
使 用 这 些 花 招 。 

为 了 使 用 标准 库 组 件 ， 程 序 中 必须 包含 其 头 文件 。 自 己 手工 写 出 相关 声明 并 不 是 一 种 符 
合 标准 的 替代 方式 。 原 因 在 于 一 些 C++ 实现 会 基于 包含 的 标准 头 文 件 优化 编译 ， 还 有 一 些 
C++ 实现 提供 了 由 头 文件 触发 的 标准 库 组 件 优化 版 本 。 一 般 而 言 ，C++ 实现 者 使 用 标准 库 的 
方式 是 普通 程序 员 无 法 预测 的 ， 也 无 需 了 解 。 
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但 是 ,程序 员 可 以 针对 非 标准 库 和 用 户 自 定义 类 型 特例 化 组 件 模板 ， 例 如 swap() ( 见 
35.5.2 节 )。 
30.3 语言 支持 


语言 支持 是 标准 库 中 一 个 很 小 但 至 关 重 要 的 部 分 ， 是 程序 正常 运行 所 必需 的 ， 因 为 语言 
特性 依赖 于 这 些 组 件 。 


标准 库 支 持 的 语言 特性 
<new> new 和 delete 和 
<typeinfo> typeid() 和 type_info 22.5 节 
<iterator> 范围 for 30.3.2 区 
<initializer_list> initializer_list 30.3.1 节 


30.3.1 initializer_list 支持 
一 个 颁 列 表 会 依据 11.3 节 中 介绍 的 规则 转换 为 一 个 std::initializer_list<X> 类 型 的 对 
象 。 在 <initializer_list> 中 ， 我 们 可 以 找到 initializer_list 的 定义 : 


template<typename T> 
class initializer_list { 儿 Wiso.18.9 


public: 
using value type =T; 
using reference = const T&; 儿 注意 const: initializer list 的 元 素 是 不 可 改变 的 


using const_reference = const T&; 
using size_type = size ft; 

using iterator = const T*; 

using const_iterator = const T*; 


initializer_list() noexcept; 


size_t size() const noexcept; 川 元 素数 
const T* begin() const noexcept; /|/ 首 元 素 
const T* end() const noexcept; 川 尾 后 元 素 


» 


template<typename T> 

const T* begin(initializer_list<T> Ist) noexcept { return ist.begin(); } 
template<typename T> 

const T* end(initializer_list<T> lst) noexcept { return lst.end(); } 


不 幸 的 是 ，initializer_list 并 未 提供 下 标 运算 符 。 如 果 你 希望 用 [而 不 是 *， 可 对 指针 使 用 
下 标 : 
void flinitializer_list<int> ist) 


for(int i=0; i<lst.size(); ++i) 
cout << lstfi] << "\n'; 咱 错 误 


const int* p = lst.begin(); 
for(int i=0; i<lst.size(); ++i) 
cout << pli] << \n'; 儿 正确 
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initializer_list 自然 也 可 用 于 范围 for 语句 ， 例 如 : 
void f2(initializer_list<int> lst) 
{ 
for (auto x : Ist) 
cout << x << \n'; 


} 


30.3.2 ”范围 for 支持 


如 9.5.1 节 所 介绍 ， 一 条 范围 for 语句 会 借助 迭代 器 映射 为 一 条 for 语句 。 

在 <iterator> 中 ， 标 准 库 提供 了 std::begin() 和 std::end() 两 个 函数 ， 可 用 于 内 置 数组 
及 任何 提供 了 begin() 和 end() 成 员 的 类 型 ， 见 33.3 节 。 

所 有 标准 库容 器 (如 vector 和 unordered_map) 和 字符 串 都 支持 使 用 范围 for 的 迭代 ; 
容器 适配器 (如 stack 和 priority_ queue) 则 不 支持 。 容 器 的 头 文件 (如 <vector>) 会 包含 
<initializer_list>， 因 此 用 户 很 少 需要 自己 直接 包含 它 。 


30.4 ”错误 处 理 


标准 库 包 含 的 组 件 已 有 将 近 40 年 的 开发 历程 。 因 此 ， 它 们 处 理 错误 的 风格 和 方法 并 不 
统一 : 
e C 风格 库 函 数 大 多 数 通过 设置 errno 来 指示 发 生 了 错误 ; 见 13.1.2 节 和 40.3 节 。 
e 很 多 对 元 素 序列 进行 操作 的 算法 返回 一 个 尾 后 迭代 器 来 指示 “未 找到 ”或 “失败 ”; 
见 33.1.1 节 。 
e 1/0 流 库 要 依赖 于 每 个 流 中 的 一 个 状态 来 反映 错误 ， 并 可 能 (根据 用 户 需 要 ) 通过 抛 
出 异常 来 指示 错误 ; 见 38.3 节 。 
e@ 一 些 标准 库 组 件 ， 如 vector、string 和 bitset 通过 抛 出 异常 来 指示 错误 。 
标准 库 的 设计 目标 之 一 是 所 有 组 件 都 遵守 “基本 保证 ”( 见 13.2 节 ); 即 ， 即 使 抛 出 了 异 
常 ， 也 不 会 有 资源 (如 内 存 ) 泄漏 ， 旦 不 会 有 标准 库 类 的 不 变 式 被 破坏 的 情况 出 现 。 


30.4.1 异常 
一 些 标准 库 组 件 通过 抛 出 异常 来 报告 错误 : 








标准 库 异 常 
bitset 抛 出 invalid_argument、out_of _ range、overflow_error 
iostream 如 果 人 允许 异常 的 话 ， 抛 出 ios_base::failure 
regex 抛 出 regex_error 
string 抛 出 length_error、out_of_range 
vector 抛 出 out_of_range 
newT 如 果 不 能 为 一 个 T 分 配 内 存 ， 抛 出 bad_alloc 
dynamic_cast<T>(r) 如 果 不 能 将 引用 『 转换 为 一 个 T， 抛 出 bad_cast 
typeid() 如 果 不 能 获得 一 个 type_info， 抛 出 bad_typeid 
thread 抛 出 system_error 
call once() 抛 出 system_error 


mutex 抛 出 system_error 
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( 续 ) 
标准 库 异 常 
condition_variable 抛 出 system_error 
async() 抛 出 system_error 
packaged task 抛 出 system_error 
future 和 promise 抛 出 future_error 


任何 直接 或 间接 使 用 这 些 组 件 的 代码 都 可 能 遇 到 这 些 异 常 。 而 且 ， 对 任何 操作 ， 如 果 它 处 
理 可 能 抛 出 异常 的 对 象 ， 那 么 我 们 必须 假定 这 个 操作 也 抛 出 此 异常 ， 除 非 已 经 小 心地 避免 
了 这 种 情况 的 发 生 。 例 如 ， 如 果 packaged_task 要 求 执行 的 函数 会 抛 出 一 个 异常 ， 那 么 
packaged_task 也 会 抛 出 一 个 异常 。 

除非 你 确认 使 用 组 件 的 方式 不 会 令 它 们 抛 出 异常 ， 否 则 坚持 在 某 处 (如 main()) 捕获 标 
准 库 异 常 类 层次 的 某 个 根 类 (如 exception) 和 任意 异常 (…) 是 一 个 很 好 的 编程 习惯 。 
30.4.1.1 标准 库 exception 类 层次 

不 要 抛 出 int、C 风格 字符 串 等 内 置 类 型 ， 而 应 抛 出 专门 表示 异常 的 类 型 的 对 象 。 

标准 库 异 常 类 层次 提供 了 一 种 对 异常 分 类 的 方式 : 


exception 
wd ss 
logic_error runtime_error 

length_error Sn range_error 
domain_error bad_exception bad _cast overflow_error 

out_of_range bad alloc bad typeid \underflow_error 

invalid_argument system_error 
future_error 
bad_array_new_length ios_base::failure 


这 个 类 层次 尝试 提供 一 个 异常 框架 ， 比 标准 库 中 所 定义 的 异常 框架 更 大 。 人 逻辑 错误 是 指 原则 
上 在 程序 投入 运行 之 前 就 应 被 捕获 或 是 通过 函数 实 参 测试 发 现 的 错误 。 所 有 其 他 错误 都 属于 
运行 时 错误 。system_error 将 在 30.4.3.3 节 中 介绍 。 

标准 库 异 常 类 层次 以 类 exception 为 根 : 


class exception { 
public: 
exception(); 
exception(const exception&); 
exception& operator=(const exception&); 
Virtual “exception(); 
Virtual const char* what() const; 
}; 
函数 what() 可 以 用 来 获取 一 个 字符 串 ， 该 字符 串 应 该 指出 导致 此 异常 的 错误 的 一 些 信息 。 
程序 员 可 以 通过 派生 标准 库 异 常 类 来 定义 自己 的 异常 : 


struct My_error : runtime_error { 
My_error(int x) :runtime_error{"My_error"}, interesting_value{x} {} 
int interesting_value; 
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并 非 所 有 异常 都 是 标准 库 exception 类 层次 的 一 部 分 ， 但 标准 库 自身 抛 出 的 所 有 异常 都 来 自 
exception 类 层次 。 

除非 你 确认 程序 中 没有 组 件 会 抛 出 异常 ， 否 则 在 程序 某 个 位 置 捕获 所 有 异常 是 一 个 好 习 
惯 。 例 如 : 


int main() 


try { 
ls 


} 

catch (My_error& me) { 咱 发 生 了 一 个 My_error 
儿 我 们 可 以 使 用 me.interesting_value 和 me.what() 

} 

catch (runtime_error& re){  // 发生 了 一 个 runtine_error 
/我 们 可 以 使 用 re.what() 


} 
catch (exception& e) { 1 发生 了 一 个 标准 库 异 常 
儿 我 们 可 以 使 用 e.what() 





} 
catch (...) { 儿 发 生 了 某 个 上 面 未 提 及 的 异常 
/我 们 可 以 做 一 些 局 部 清理 


类 似 函 数 实 参 ， 我 们 这 里 用 引用 来 避免 切片 现象 ( 见 17.5.1.4 节 )。 
30.4.1.2 ”异常 传播 
<exception> 中 提供 了 一 些 组 件 ， 令 异常 传播 对 程序 员 可 见 : 


异常 传播 (iso.18.8.5 ) 





exception_ptr 非特 定 的 异常 指针 类 型 

ep=current_exception() ep 是 一 个 exception_ptr， 指 向 当前 异常 ， 若 当前 无 活动 异常 则 不 指向 任何 
异常 ; 不 抛 出 异常 

rethrow_exception(ep) 重 抛 出 ep 指向 的 异常 ; ep 包含 的 不 能 是 空 指 针 nullptr ; 无 返回 值 ( 见 
12.1.7 节 ) 


ep=make_exception_ptr(e) ep 是 指向 exception e 的 exception_ptr; 不 抛 出 异常 


一 个 exception_ptr 可 以 指向 任何 异常 ， 不 局 限于 exception 类 层次 中 的 异常 。 可 将 
exception_ptr 看 作 一 种 智能 指针 (类似 shared_ptr) 一 一 只 要 一 个 exception_ptr 还 指向 其 
异常 ， 那 么 这 个 异常 就 会 保持 活跃 。 这 样 ， 我 们 就 可 以 通过 exception_ptr 将 一 个 异常 从 捕 
获 它 的 函数 中 传递 出 来 ， 并 在 其 他 某 个 地 方 重新 抛 出 。 即 ，exception_ptr 可 用 来 实现 在 捕 
获 线程 之 外 的 其 他 某 个 线程 中 重 抛 出 异常 ， 这 是 promise 和 future ( 见 42.4 节 ) 所 需要 的 。 
对 一 个 exception_ptr 使 用 rethrow_exception (在 不 同 线程 中 ) 不 会 引起 数据 竞争 。 

我 们 可 以 像 下 面 这 样 实现 make_exception_ptr: 


template<typename E> 
exception_ptr make_exception_ptr(E e) noexcept; 


try { 
throw e; 


} 
catch(...) { 
return current_exception(); 


} 
nested_exception 是 一 个 类 ,保存 从 一 次 current_exception() 调用 中 得 到 的 exception_ptr。 





nested_exception nef}; 


nested_exception ne{fne2}; 
ne2=ne 

ne. nested_exception() 

ne .rethrow_nested() 


ep=ne.nested_ptr() 
throw_with_nested(e) 


rethrow_if_nested(e) 
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nested_exception (iso.18.8.6 ) 

默认 构造 函数 : ne 保存 一 个 指向 current_exception() 的 exception_ptr ; 不 抛 
出 异常 

拷贝 构造 函数 : ne 和 ne2 都 保存 指向 同一 个 异常 的 exception_ptr 

拷贝 赋值 运算 符 : ne 和 ne2 都 保存 指向 同一 个 异常 的 exception_ptr 

析 构 函数 ; 虚 函 数 

重 抛 出 ne 保存 的 异常 ; 若 ne 中 未 保存 任何 异常 ， 则 会 terminate() ; 不 抛 出 
异常 

ep 是 一 个 exception_ptr， 指 向 ne 保存 的 异常 ; 不 抛 出 异常 

抛 出 一 个 异常 ， 其 类 型 是 从 nested_exception 和 e 的 类 型 派生 出 的 ; e 不 能 派 
生 自 nested_exception; 无 返回 值 

dynamic_cast<const nested_exception&>(e).rethrow_nested() ; e 的 类 型 不 
能 派生 自 nested_exception 





nested_exception 的 预期 用 途 是 作为 一 个 类 的 基 类 ， 该 类 被 异常 处 理 程序 用 来 传递 错误 的 局 部 
上 下 文 相关 信息 ， 同 时 传递 的 还 有 一 个 exception_ptr， 指 向 触发 处 理 程序 的 那个 异常 。 例 如 : 


struct My_error : runtime_error { 
My_error(const string&); 


/1 人 
}; 


void my_code!() 


try { 
J 


catch (...) { 


My_error err {"something went wrong in my_code() )}; 


Ws 


throw_with_nested(err); 


} 
} 


My_error 信息 与 一 个 nested_exception 一 起 被 传递 ( 重 抛 出 )， 这 个 nested_exception 保 
存 一 个 指向 被 捕获 异常 的 exception_ptr。 
在 调用 链 中 继续 深入 ， 我 们 可 能 希望 查看 坐 套 的 异常 : 


void user() 
{ 


try { 
my_codel(); 


catch(My_error& err) { 


咱 .… 清理 My_error 问题 … 


try { 


rethrow_if_nested(err); ”// 重 抛 出 嵌 套 的 异常 (如 果 有 的 话 ) 


} 


catch (Some_error& err2) { 
外. 清理 Some_error 问题 … 


} 
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这 段 代码 假定 我 们 知道 some_error 可 能 租 套 在 My_error 中 。 
异常 不 能 从 noexcept 函数 中 传播 出 去 ( 见 13.5.1.1 节 )。 
30.4.1.3 terminate() 
在 <exception> 中 ,标准 库 提供 了 处 理 意外 异常 的 组 件 : 


terminate (iso.18.8.3, iso.18.8.4 ) 


h=get_terminate() h 为 当前 终止 处 理 程序 ; 不 抛 出 异常 

h2=set_terminate() 当前 终止 处 理 程 序 被 设 定 为 h; h2 为 旧 终 止 处 理 程序 ;不 抛 出 异常 
terminate() 终止 程序 ; 无 返回 值 ; 不 抛 出 异常 

uncaught_exception() 当前 线程 有 已 抛 出 且 尚 未 捕获 的 异常 吗 ? 不 抛 出 异常 


除了 极 特殊 的 情况 下 使 用 set_ terminate() 和 terminate() 之 外 ， 其 他 情况 应 避免 使 用 这 些 函 
数 。 调 用 terminate() 会 通过 继续 调用 终止 处 理 程序 来 终止 当前 程序 ， 终止 处 理 程序 由 set_ 
terminate() 设置 。 默 认 操 作 是 立即 终止 当前 程序 ， 这 几乎 总 是 正确 的 。 出 于 底层 操作 系统 
方面 的 原因 ， 当 调用 terminate() 时 局 部 变量 的 析 构 函数 是 否 会 被 调用 是 由 具体 C++ 实现 所 
决定 的 。 如 果 terminate() 调用 是 因为 违反 noexcept 规则 而 被 触发 的 ， 系 统 允许 进行 一 些 
(重要 的 ) 优化 ， 甚 至 可 能 对 栈 进 行 部 分 展开 ( 见 iso.15.5.1 )。 

有 些 析 构 函数 的 行为 依赖 于 某 个 函数 是 正常 退出 还 是 因 异 常 退出 而 有 所 不 同 ， 人 们 认为 
uncaught_exception() 对 编写 这 类 析 构 函数 非常 有 有 用。 但是， 在 最 初 的 异常 被 捕获 后 ， 栈 展 
开 期 间 uncaught_exception() 也 会 为 真 ( 见 13.5.1 节 )。 我 认为 uncaught_exception() 对 于 
实际 应 用 来 说 太 微妙 了 。 


30.4.2 断言 
标准 库 提供 了 断言 机 制 。 
static_assert(e,s) 在 编译 时 对 e 求 值 ; 若 !e 为 假 则 将 s 作为 编译 器 错误 消息 输出 
assert(e) 若 宏 NDBUG 未 定义 ， 则 在 运行 时 对 e 进行 求 值 ， 若 !e 为 假 ， 向 cerr 输出 一 个 消息 
并 调用 abort(); 若 定义 了 NDBUG ， 则 什么 也 不 做 
例如 : 


template<typename T> 
void draw_all(vector<T*>& v) 


{ 
static_assert(ls_base_of<Shape,T>(),"non-Shape type for draw_all()"); 
for (auto p : v}{ 
assert(p!=nuliptr); 
有: 
} 
} 


assert() 是 一 个 宏 ， 定 义 在 <cassert> 中 。assert() 生成 什么 错误 信息 由 C++ 具体 实现 自己 
决定 ， 但 应 包含 源 文件 名 ( ”FILE _) 和 assert() 所 在 的 源码 行 号 (LINE__)。 
断言 常常 用 于 产品 级 代码 而 非 教 材 的 小 例子 中 ( 它 也 本 应 如 此 )。 
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函数 名 (__ func __) 也 可 能 包含 在 消息 中 。 如 果 假 定 assert() 被 求 值 但 实际 却 没有 时 ， 
就 会 导致 严重 错误 。 例 如 ， 在 常见 的 编译 器 设置 下 ，assert(p!=nullptr) 在 调试 时 会 捕获 一 个 
错误 ,但 在 最 终 发 布 的 产品 程序 中 就 不 会 。 

管理 断言 的 方法 请 参阅 13.4 节 。 


30.4.3 System_error 


在 <system_error> 中 ， 标 准 库 提 供 了 一 个 能 从 操作 系统 和 底层 系统 组 件 报告 错误 的 杠 


架 。 例 如 ， 我 们 可 以 编写 一 个 函数 检查 文件 名 然后 打开 此 文件 : 
ostream& open file(const string& path) 
{ 
auto dn = split_into_directory_and_name(path); /1 分 解 为 { 路 径 名 ,文件 名 } 
error_code err {does_directory_exist(dn .first)}; 外 向 “系统 ”询问 路 径 名 


if (err){ JW err!l=o 意味 着 发 生 了 错误 
1 .… 看 看 可 以 做 什么 事 … 


if (cannot_handle_err) 
throw system_error(err); 


} 


Wis 
return ofstream{path}; 


} 
假定 “系统 ”不 知道 C++ 异常 ， 在 是 否 处 理 错 误 代 码 上 我 们 就 没 得 选择 了 ; 剩 下 的 问题 就 
是 “在 哪 ” 处 理 以 及 “如 何 ”处 理 了 。<system_error> 中 提供 了 一 些 组 件 ， 能 实现 错误 码 
分 类 、 将 系统 相关 的 错误 码 映 射 为 可 移植 性 更 好 的 代码 以 及 将 错误 码 映 射 为 异常 : 





error_code 保存 一 个 值 ， 指 出 错误 码 和 错误 类 别 ; 是 系统 相关 的 ( 见 30.4.3.1 节 ) 

error_category 一 些 类 型 的 基 类 ， 这 些 类 型 用 来 指明 一 类 特定 的 错误 码 的 来 源 和 编码 方式 ( 见 30.4.3.2 节 ) 
system_error 一 个 runtime_error 异常 ， 包 含 了 一 个 error_code ( 见 30.4.3.3 节 ) 

error_condition ”保存 一 个 值 ， 指 明了 一 个 错误 和 该 错误 的 类 别 ; 可 能 具有 可 移植 性 ( 见 30.4.3.4 节 ) 

erroc enum class， 其 枚 举 值 是 为 <cerrno> 中 的 错误 码 定 义 的 ( 见 40.3 节 ); 基本 POSIX 错误 码 
future_errc enum class， 其 枚 举 值 是 为 <future> 中 的 错误 码 定义 的 ( 见 42.4.4 节 ) 

io_errc enum class， 其 枚 举 值 是 为 <ios> 中 的 错误 码 定 义 的 ( 见 38.4.4 节 ) 


30.4.3.1 错误 码 

当 一 个 错误 以 错误 码 的 形式 从 程序 底层 “浮上 来 ”时 ， 我 们 必须 处 理 这 个 错误 或 将 错误 
码 转 换 为 一 个 异常 。 但 首先 我 们 要 对 错误 码 进行 分 类 : 不 同系 统 对 同一 个 问题 可 能 使 用 不 同 
的 错误 码 ， 而 不 同系 统 也 会 有 不 同类 型 的 错误 。 


error_code (iso.19.5.2 ) 
error_code ec {}; 默认 构造 函数 : ec={0,&generic_category}; 不 抛 出 异常 
error code ec {n,cat}; ec={n,cat}; cat 是 一 个 error_category, n 是 表示 cat 中 某 个 错误 的 整数 ; 
不 抛 出 异常 
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error_code ec {n}; 


ec.assign(n,cat) 


ec=n 


ec.clear() 
n=ec.value() 
cat=ec.category() 
S=ec.message() 


bool bf{ec}; 


a 





( 续 ) 





error_code (iso.19.5.2 ) 

ec={n,&generic_category} ; n 表示 某 个 错误 ; n 是 一 个 EE 类 型 值 ， 且 
满足 is_error_code_enum<EE>::value==true; 不 抛 出 异常 

ec={n,cat}; cat 是 一 个 error_category; n 表示 某 个 错误 ， 是 一 个 EE 类 
型 值 且 满足 is_error_code_enum<EE>::value==true; 不 抛 出 异常 

ec={n,&generic_category}:ec=make_error_code(n) ; n 表示 某 个 错误 ， 是 
一 个 EE 类 型 值 上 且 满 足 is_error_code_enum<EE>::value==true; 不 抛 出 异常 

ec={0,&generic_category()}; 不 抛 出 异常 

n 获得 ec 中 保存 的 值 ; 不 抛 出 异常 

cat 是 一 个 引用 ， 指 向 ec 中 保存 的 类 别 ; 不 抛 出 异常 

s 是 一 个 表示 ec 的 string， 可 能 用 作 错 误 消 息 : ec.category(). 
message(ec.value()) 

将 ec 转换 为 bool 值 ; 若 ec 表示 一 个 错误 ， 则 b 为 true ; 即 b==false 


意味 着 “无 错误 ”;， 显 式 初始 化 

ec==ec2 ec 和 ec2 两 者 或 其 中 之 一 是 error_code ; 比较 ec 和 ec2， 它 们 必须 有 
相同 的 category() 和 相同 的 value() 才 认 为 是 相等 ; 如 果 ec 和 ec2 是 相同 
类 型 ， 则 等 价 性 由 == 定义 ; 否则 ， 等 价 性 由 category().equivalent() 定义 。 

ecl=ec2 !(ec==ec2) 

ec<ec2 序 ec.category()<ec2.category() || (ec.category()==ec2.category() && 
ec.value()<ec2.value()) 

e=ec.default_error_condition() e 是 一 个 引用 ， 指 向 一 个 error_condition:e=ec.category().default_ 
error_condition(ec.value()) 

os<<ec 将 ec.name() 输出 到 ostream os 


ec=make_error_code(e) e 是 一 个 errc:ec=error_code(static_cast<int>(e),&g eneric_category()) 


作为 一 个 表示 简单 错误 码 概念 的 类 型 ，error_code 提供 了 太 多 的 成 员 ， 其 实 它 本 质 上 是 一 
个 从 整数 到 error_category 指针 的 简单 映射 


class error_code { 
public: 

/表示 形式 : { 值 ,类 别 }， 类 型 为 {int,const error_ category*} 
}; 


error_category 为 派生 自 它 的 类 的 对 象 提供 了 接口 。 因 此 ， 一 个 error_category 以 引用 传 
递 ， 保 存 为 指针 。 每 个 单独 的 error_category 由 一 个 唯一 的 对 象 来 表示 。 
再 次 考虑 open_file() 的 例子 : 


ostream& open _file(const string& path) 


{ 
auto dn = split_into_directory_and_name(path); /| 分 解 为 { 路 径 名 ,文件 名 } 


if (error_code err {does_directory_exist(dn.first)}) { 儿 向 “系统 ”询问 路 径 名 
if (err==errc::permission_denied) { 
ss 


else if (err==errc::not_a_directory) { 
dsa 
} 
throw system_error(err); // 在 局 部 什么 也 做 不 了 
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Ws 
return ofstream{path}; 


} 


错误 码 errc 将 在 30.4.3.6 节 中 介绍 。 注 意 我 使 用 了 if-then-else 条 件 判断 链 而 不 是 更 显 而 易 
见 的 switch 语句 。 原 因 是 == 相等 性 判定 既 考 虑 错误 category() 也 考虑 错误 value()。 

对 error_code 的 操作 因 系 统 而 异 。 在 某 些 情况 下 ， 可 以 使 用 30.4.3.5 节 中 介绍 的 机 
制 将 error_code 映射 为 error_condition ( 见 30.4.3.4 节 )。 我 们 也 可 以 用 ve 
condition() 从 error_code 中 抽取 出 error_condition。error_condition 包含 的 信息 通常 上 
error_code 少 ， 因 此 保存 error_code 而 仅 在 需要 时 抽取 出 error_condition， 这 通常 2 
好 做 法 。 

对 error_code 进行 操作 不 会 改变 errno 的 值 ( 见 13.1.2 节 和 40.3 节 )。 标 准 库 也 不 会 改 
变 其 他 库 提供 的 错误 状态 。 
30.4.3.2 ”错误 类 别 

一 个 error_category 表示 一 个 错误 分 类 。 特 定 错误 由 类 error_category 的 派生 类 表示 : 


class error_category { 
public: 
1/… 派生 自 error_category 的 特定 类 别 的 接口 … 


}; 
error_category (iso.19.5.1.1 ) 

cat.“error_category() 析 构 函数 ; 虚 函 数 ; 不 抛 出 异常 

s=cat.name() s 是 cat 的 名 字 ， 是 一 个 C 风格 的 字符 串 ; 虚 函 数 ; 不 抛 出 异常 

ec=cat.default_error_condition(n) ec 是 cat 中 的 error_condition; 不 抛 出 异常 

cat.equivalent(n,ec) ec.category()==cat 上 且 ec.value()==n 中? ec 是 一 个 error_condition ; 
虚 函 数 ; 不 抛 出 异常 

cat.equivalent(ec,n) ec.category()==cat 日 ec.value()==n 吗 ? ec 是 一 个 error code ; 虚 
函数 ; 不 抛 出 异常 

s=cat.message(n) s 是 描述 cat 中 错误 n 的 string; 虚 函 数 

cat==cat2 cat 与 cat2 类 别 相同 吗 ? 不 抛 出 异常 

cat!=cat2 !(cat==cat2); 不 抛 出 异常 

cat<cat2 cat<cat2 在 基于 error_category 地 址 的 序 中 ， 满 足 std::less<const 


error_category*>()(cat, cat2) 吗 ? 不 抛 出 异常 


由 于 error_category 的 设计 目的 是 用 作 基 类 ， 因 此 不 提供 拷贝 或 移动 操作 。 访 问 error_ 
category 对 象 需要 使 用 指针 或 引用 。 
标准 库 定 义 了 4 种 命名 的 错误 类 别 。 


标准 库 错 误 类 别 (iso.19.5.1.1 ) 


ec=generic_category() ec.name()=="generic"; ec 是 一 个 指向 error_category 的 引用 

ec=system_category() ec.name()=="system" ; ec 是 一 个 指向 error_category 的 引用 ; 表示 系统 
错误 ; 如 果 ec 对 应 一 个 POSIX 错误 ， 则 ec.value() 等 于 该 错误 的 errno 

ec=future_category() ec.name()=="future" ; ec 是 一 个 指向 error_category 的 引用 ; 表示 
<future> 中 的 错误 

iostream_category() ec.name()=="iostream" ; ec 是 一 个 指向 error_category 的 引用 ; 表示 


iostream 库 中 的 错误 





这 些 类 别 是 必要 的 ， 因 为 一 个 简单 的 整数 错误 码 在 不 同 的 上 下 文 (category) 中 可 能 有 不 同 
的 含义 。 例 如 ，1 在 POSIX 中 表示 “不 允许 的 操作 ”( EPERM)， 如 果 是 iostream 错误 则 
表示 所 有 错误 的 通用 代码 ( state )， 如 果 是 一 个 future 错误 则 表示 “已 收 到 future”(future_ 
already_retrieved )。 
30.4.3.3 system_error 异常 

system_error 报告 的 错误 都 源 自 标 准 库 中 处 理 操作 系统 的 部 分 。 它 传递 一 个 error_ 
code， 并 可 传递 一 个 错误 消息 字符 串 : 


class system_error : public runtime_error { 





public: 
as 
}; 
异常 类 system_error (iso.19.5.6 ) 
system_error se {ec,s}; se 保存 {ec,s}; ec 是 一 个 error_code; s 是 一 个 string 或 一 个 C 风格 字符 串 ， 
作为 错误 消息 的 一 部 分 
system_error se {ec)}; se 保存 {ec}; ec 是 一 个 error_code 
system_error se {n,cat,s}; se 保存 {ferror_code{fn,catj,s} ; cat 是 一 个 error_category, n 是 一 个 int， 表 
示 cat 中 的 一 个 错误 ; s 是 一 个 string 或 一 个 C 风格 字符 串 ， 作 为 错误 消息 的 一 
部 分 
System_error se {n,cat}; se 保存 error_code{fn,cat} ; cat 是 一 个 error_category, n 是 一 个 int， 表 示 
cat 中 的 一 个 错误 
ec=se .code() ec 为 指向 se 的 error_code 的 引用 ; 不 抛 出 异常 
p=se .what() p 为 se 的 错误 字符 串 的 C 风格 版 本 ; 不 抛 出 异常 


捕获 system_error 的 程序 可 获得 其 error_code。 例 如 : 


try{ 
儿 做 某 些 操作 
} 


catch (system_error& err) { 
cout << "caught system_error " << err.what() <<"\n'; 几 /错误 信息 


auto ec = err.code(); 

cout << "category: " << ec.category().what() <<\n'; 
cout << "value: " << ec.value() <<"\n'; 

cout << "message: " << ec.message() <<'"\n'; 


} 
自然 地 ，system_error 可 用 于 标准 库 之 外 的 程序 。 它 传递 一 个 系统 相关 的 error_code，, 而 
不 是 一 个 可 移植 的 error_condition ( 见 30.4.3.4 节 )。 为 了 从 error_code 获得 一 个 error_ 
condition ， 可 使 用 default_error_condition() ( 见 30.4.3.1 节 )。 
30.4.3.4 ”可 移植 的 错误 状态 
可 移植 错误 码 (error_condition) 的 表现 形式 与 系统 相关 的 error_code 几乎 相同 : 
class error_condition { /潜在 可 移植 ( 见 iso.19.5.3 ) 
public: 
儿 类 似 error_code 
儿 但 没有 输出 运算 符 (<<) 
// 和 默认 error_condition() 
}; 
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总 体 思路 是 每 个 系统 有 一 组 特有 的 (“原生 的 ”) 错误 码 ， 可 映射 到 潜在 可 移植 的 错误 码 ， 这 
样 对 于 需要 跨 平 台 编程 的 程序 员 (通常 是 编写 库 的 程序 员 ) 来 说 就 会 更 加 方便 。 
30.4.3.5 ”映射 错误 码 

我 们 用 一 组 error_code 和 至 少 一 个 error_condition 创建 一 个 error_category， 首 先 要 
定义 一 个 枚 举 类 型 表示 所 需 的 error_code 值 。 例 如 : 


enum class future_errc { 
broken_promise = 1, 
future_aiready_retrieved, 
promise_already satisfied, 
no_state 
}; 
这 些 值 的 含义 完全 依赖 于 具体 错误 类 别 。 这 些 枚 举 值 的 具体 整数 值 由 具体 实现 定义 。 
future 错误 类 别 是 标准 的 一 部 分 ， 因 此 可 以 在 你 所 使 用 的 标准 库 中 找到 它 ， 但 细节 可 能 
与 我 描述 的 有 所 不 同 。 
接 下 来 ,我 们 需要 为 错误 码 定义 一 个 合适 的 类 别 : 
class future_cat : error_category { 外 future_category() 返回 此 类 型 


public: 
const char: name() const noexcept override { return "future”"; } 


string message(int ec) const override; 


六 
const error_category& future_category() noexcept 
{ 
static future_cat obj; 
return &obj; 
} 


将 整 型 值 映射 为 错误 message() 字符 串 的 过 程 有 些 元 长 乏味 。 我 们 必须 创造 一 组 对 程序 员 
来 说 可 能 有 意义 的 消息 。 在 本 例 中 ， 我 不 想 自作 聪明 : 


string future_error::message(int ec) const 


{ 
Switch (ec) { 
default: return "bad future_error code"; 
future_errc::broken_promise: return "future_error: broken promise"; 
future_errc::future_already_retrieved: return "future_error: future already retrieved"; 
future_errc::promise_already _ satisfied: return "future_error: promise already satisfied"; 
future_errc::no_state: return "future_error: no state"; 
} 

} 


我 们 现在 可 以 从 一 个 future_errc 创建 一 个 error_code 了 : 


error_code make_error_code(future_errc e) noexcept 


{ 


return error_codefint(e),future_category()}; 


} 
对 于 接受 单一 错误 码 的 error_code 构造 函数 和 赋值 运算 符 而 言 ， 要 求实 参 的 类 型 对 error_ 
category 来 说 是 恰当 的 。 例 如 ， 如 果实 参 将 要 成 为 future_category() 的 一 个 error_code 的 
value()， 则 它 的 类 型 必须 是 future_errc。 特 别 是 ,我们 不 能 简单 地 使 用 int 类 型 。 例 如 : 
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error_code ec1 {7}; 


error_code ec2 {future_errc::no_state)}; 


ec1=9; 


ec2 = future_errc::promise_already_satisfied; 


ec2 = errc::broken_pipe; 


为 了 帮助 程序 员 实 现 error_ code， 我 们 从 定义 的 枚 举 类 型 特例 化 出 萃取 is_error code _ 


enum : 


template<> 


/| 错误 
儿 正确 


儿 错误 
// 正确 
儿 错误 


: 错误 类 别 不 正确 


struct is_error_code enum<future_errc> : public true_type {); 


标准 库 已 经 提供 了 通用 模板 : 


template<typename> 


struct is_error_code_enum : public false_type {}; 


这 条 语句 声明 : 凡是 我 们 不 视 为 错误 码 的 值 就 不 是 错误 码 。 为 了 让 error_condition 能 用 于 


我 们 的 错误 类 别 ， 必 须 重 复 对 error_code 所 做 的 事情 。 例 如 : 


error_condition make_error_condition(future_errc e) noexcept; 


template<> 


struct is_error_condition_enum<future_errc> : public true_type {}; 


我 们 可 以 对 error_condition 使 用 一 个 独立 的 enum， 并 为 make_error_condition 实现 一 个 


从 future_errc 到 它 的 映射 ， 这 会 是 一 个 更 有 趣 的 设计 。 


30.4.3.6 ”errc 错误 码 


标准 库 中 system_category() 的 error_code 是 由 enum class errc 定义 的 ， 其 值 等 于 


来 自 于 <cerrno> 中 的 POSIX 衍生 内 容 : 


address_family_not_supported 


address_in_use 
address_not_available 
already_connected 
argument_list_too_long 


argument_out_of_domain 


bad_address 

bad _file_descriptor 
bad_message 
broken_pipe 
connection_aborted 


enum class errc 枚 举 值 (iso.19.5 ) 


connection_already_in_progress 


connection_refused 
connection_reset 
cross_device_link 


destination_address_required 


device_or_resource_busy 


directory_not_empty 
executable_format_error 








EAFNOSUPPORT 
EADDRINUSE 
EADDRNOTAVAIL 
EISCONN 

E2BIG 

EDOM 

EFAULT 

EBADF 
EBADMSG 
EPIPE 
ECONNABORTED 
EALREADY 
ECONNREFUSED 
ECONNRESET 
EXDEV 
EDESTADDRREQ 
EBUSY 
ENOTEMPTY 
ENOEXEC 
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enum class errc 枚 举 值 (iso.19.5 ) 


file_exists 

file_too_large 
filename_too_long 
function_not_supported 
host_unreachable 
identifier_removed 
illegal_byte_sequence 
inappropriate_io_control_operation 
interrupted 
invalid_argument 
invalid_seek 

io_error 

is_a_directory 
message_size 
network_down 
network_reset 
network_unreachable 
no_buffer_space 
no_child_process 
no_link 
no_lock_available 
no_message 
no_message_available 
no_protocol_option 
no_space_on_device 
no_stream_resources 
no_such_device 
no_such_device_or_address 
no_such file_or_directory 
no_such_process 
not_a_directory 
not_a_socket 
not_a_stream 
not_connected 
not_enough_memory 
not_supported 
operation_canceled 
operation_in_progress 
operation_not_permitted 
operation_not_supported 
operation_would_block 
owner_dead 
permission_denied 
protocol_error 


EEXIST 

EFBIG 
ENAMETOOLONG 
ENOSYS 
EHOSTUNREACH 
EIDRM 

EILSEQ 
ENOTTY 
EINTR 

EINVAL 
ESPIPE 

EIO 

EISDIR 
EMSGSIZE 
ENETDOWN 
ENETRESET 
ENETUNREACH 
ENOBUFS 
ECHILD 
ENOLINK 
ENOLCK 
ENOMSG 
ENODATA 
ENOPROTOOPT 
ENOSPC 
ENOSR 
ENODEV 
ENXIO 
ENOENT 
ESRCH 
ENOTDIR 
ENOTSOCK 
ENOSTR 
ENOTCONN 
ENOMEM 
ENOTSUP 
ECANCELED 
EINPROGRESS 
EPERM 
EOPNOTSUPP 
EWOULDBLOCK 
EOWNERDEAD 
EACCES 
EPROTO 
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( 续 ) 

enum class errc 枚 举 值 (iso,19.5 ) 
protocol_not_supported EPROTONOSUPPORT 
read_only_file_system EROFS 
resource_deadlock_ would_occur EDEADLK 
resource_unavailable_try_again EAGAIN 
result_out_of_range ERANGE 
state_not_recoverable ENOTRECOVERABLE 
stream_timeout ETIME 
text_file_busy ETXTBSY 
timed_out ETIMEDOUT 
too_many _files_open EMFILE 
too_many _files_open _in_system ENFILE 
too_many_links EMLINK 
too_many_symbolic_link_levels ELOOP 
value_too_large EOVERFLOW 
wrong_protocol_type EPROTOTYPE 


这 些 错 误 码 对 “system” 类 别 system_category() 是 有 效 的 。 在 支持 类 POSIX 组 件 的 系统 
上 ， 它 们 对 “generic” 类 别 generic_category() 也 是 有 效 的 。 
POSIX 宏 都 是 整数 ， 而 errc 枚 举 值 的 类 型 是 errc。 例 如 : 


void problem(errc e) 


{ 
if (e==EPIPE) { 儿 错误: 不 能 将 errc 转换 为 int 
1 sa 
} 
if (e==broken_pipe) { 1 错误 : broken pipe 不 在 作用 域 中 
HH», 
} 
if (e==errc::broken_pipe) { /正确 
1... 
} 
} 


30.4.3.7 ”future_errc 错误 码 
标准 库 中 future_category() 的 error_code 是 由 enum class future_errc 定义 的 : 


enum class future_errc 枚 举 值 (iso.30.6.1 ) 








broken_promise 
future_already_retrieved 
promise_already_satisfied 


上 wmwN 一 


no_state 


这 些 错 误 码 对 “future” 类 别 future_category() 是 有 效 的 。 
30.4.3.8 io_errc 错误 码 
标准 库 中 iostream_category() 的 error_code 是 由 enum class io_errc 定义 的 : 
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enum class io_errc 枚 举 值 (iso.27.5.1 ) 
stream 1 





这 些 错 误 码 对 “iostream ”类 别 iostream_category() 是 有 效 的 。 
30.5 建议 
[ 1] 使 用 标准 库 组 件 保持 可 移植 性 ; 30.1 节 和 30.1.1 节 。 
[2] 使 用 标准 库 组 件 尽量 减少 维护 成 本 ; 30.1 节 。 
[3] 将 标准 库 组 件 作为 更 广泛 和 更 专门 化 的 库 的 基础 ; 30.1.1 节 。 
[4 ] 使 用 标准 库 组 件 作 为 灵活 、 广 泛 使 用 的 软件 的 模型 ，30.1.1 节 。 
[5 ] 标准 库 组 件 定义 在 命名 空间 std 中 ， 都 是 在 标准 库 头 文件 中 定义 的 ; 30.2 节 。 
[6] 每 个 C 标准 库 头 文件 X.h 都 有 其 C++ 标准 库 对 应 的 版 本 <cX>; 30.2 节 。 
[7] 必须 项 nclude 相应 的 头 文件 才能 使 用 标准 库 组 件 ; 30.2 节 。 
[8] 为 了 对 内 置 数组 使 用 范围 for， 需 要 #include<iterator>; 30.3.2 节 。 
[9] 优选 基于 异常 的 错误 处 理 而 非 返回 错误 码 方式 的 错误 处 理 ; 30.4 节 。 
[ 10 ] 始终 要 捕获 exception& (对 标准 库 和 语言 支持 的 异常 ) 和 ... (对 意料 之 外 的 异常 ); 
304.1 节 。 
[11 ]】 标准 库 exception 层次 可 以 (但 不 是 必须 支持 ) 用 于 用 户 自 定 义 异常 ; 30.4.1.1 节 。 
[ 12 ] 如 果 发 生 严重 错误 ， 调 用 terminate(); 30.4.1.3 节 。 
[ 13 ] 大 量 使 用 static_assert() 和 assert(); 30.4.2 节 。 
[ 14] 不 要 假定 assert() 总 是 会 被 求 值 ，30.4.2 节 。 
[ 15 ] 如 果 不 能 使 用 异常 ， 考 虑 使 用 <system_error>; 30.4.3 节 。 
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The C++ Programming Language, Fourth Edition 


STL 容 需 


它 新 颖 、 独 特 、 简 单 ， 它 必然 成 功 ! 
一 一 利 雷 肖 纳尔逊 


引言 

。 容 需 概览 

容器 表示 ; 对 元 素 的 要 求 

操作 概览 

成 员 类 型 ; 构造 函数 、 析 构 函 数 和 赋值 操作 ; 大 小 和 容量 ; 迭代 器 ; 元 素 访问 ; 栈 操作 ; 
列表 操作 ; 其 他 操作 


e 容器 
vector; 链表 ; 关联 容器 
e 容器 适配器 
stack; queue; priority_queue:; 
e 建议 
31.1 引言 


STL 包含 标准 库 中 的 和 迭代 器 、 容 器 、 算 法 和 函数 对 象 几 个 部 分 。STL 的 其 他 内 容 将 在 
第 32 章 和 第 33 章 中 进行 介绍 。 


31.2 ”容器 概览 


一 个 容器 保存 着 一 个 对 象 序列 。 本 节 概 述 容 器 类 型 并 简要 介绍 它们 的 特性 。 容 器 上 的 操 
作 将 在 31.3 节 中 介绍 。 

容器 可 分 类 为 : 

e@ 顺序 容器 提供 对 元 素 ( 半 开 ) 序列 的 访问 。 

@ 关联 容器 提供 基于 关键 字 的 关联 查询 。 

此 外 ， 标 准 库 还 提供 了 一 些 保存 元 素 的 对 象 类 型 ， 它 们 并 未 提供 顺序 容器 或 关联 容器 的 
全 部 功能 : 

e 容器 适配器 提供 对 底层 容器 的 特殊 访问 。 

e 拟 容器 保存 元 素 序 列 ， 提 供 容器 的 大 部 分 但 非 全 部 功能 。 

STL 容器 (顺序 和 关联 容器 ) 都 是 资源 句柄 ， 都 定义 了 拷贝 和 移动 操作 ( 见 3.3.1 节 )。 所 
有 容器 操作 都 提供 了 基本 保证 ( 见 13.2 节 ),， 确保 与 基于 异常 的 错误 处 理 机 制 能 正确 协同 工作 。 


顺序 容器 
vector<T,A> 空间 连续 分 配 的 TT 类 型 元 素 序列 ; 默认 选择 容器 
list<T,A> TT 类 型 元 素 双 向 链表 ; 当 需 要 插入 / 删除 元 素 但 不 移动 已 有 元 素 时 选择 它 
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( 续 ) 
顺序 容器 
forward_list<T,A> ”本 类 型 元 素 单 向 链表 ; 很 短 的 或 空 序列 的 理想 选择 
deque<T,A> T 类 型 元 素 双 端 队列 ; 向 量 和 链表 的 混合 ; 对 大 多 数 应 用 而 言 ， 都 比 向 量 和 链表 其 中 之 一 要 慢 


模板 参数 A 是 一 个 分 配器 ， 容 器 用 它 来 分 配 和 释放 内 存 ( 见 13.6.1 节 和 34.4 节 )。 例 如 : 


template<typename T, typename A = allocator<T>> 

class vector { 
Ws 

上 
A 的 默认 值 是 std::allocator<T> ( 见 34.4.1 节 )， 此 分 配 回 用 operator new() 和 operator 
delete() 为 元 素 分 配 和 释放 内 存 。 

这 些 容器 都 定义 在 <vector> 、<list> 和 <deque> 中 。 顺 序 容器 为 元 素 连续 分 配 内 存 (如 
vector) 或 将 元 素 组 织 为 链表 (如 forward_list)， 元 素 的 类 型 是 容器 的 成 员 value_type (就 
是 上 表 中 的 T)。deque (发 音 “ deck”) 采用 链表 和 连续 存储 的 混合 方式 。 

除非 你 有 充足 的 理由 ， 否 则 应 该 优选 vector 而 不 是 其 他 顺序 容器 。 注 意 ，vector 提供 
了 添加 、 删 除 ( 移 除 ) 元 素 的 操作 ， 这 些 操作 都 允许 vector 按 需 增长 或 收缩 。 对 于 包含 少量 
元 素 的 序列 而 言 ，vector 是 一 种 完美 的 支持 列表 操作 的 数据 结构 。 

当 在 一 个 vector 中 插入 、 删 除 元 素 时 ， 其 他 元 素 可 能 会 移动 。 与 之 相反 ,链表 或 关联 
容器 中 的 元 素 则 不 会 因为 插 人 新 元 素 或 删除 其 他 元 素 而 移动 。 

forward_list ( 单 向 链表 ) 是 一 种 专 为 空 链表 和 极 短 链表 优化 过 的 数据 结构 。 一 个 空 
forward_list 只 占用 一 个 内 存 字 。 在 实际 应 用 中 ， 有 相当 多 的 情况 链表 是 空 的 (还 有 很 多 情 
况 链表 非常 短 )。 


有 序 关 联 容器 (iso.23.4.2 ) 
C 是 比较 类 型 ，A 是 分 配器 类 型 


map<K,VC,A> 从 K 到 V 的 有 序 映射 ; 一 个 (K,V) 对 序列 
multimap<K,V,C,A> 从 K 到 V 的 有 序 映射 ; 允许 重复 关键 字 
set<K,C,A> K 的 有 序 集合 

multiset<K,C,A> K 的 有 序 集合 ; 允许 重复 关键 字 


这 些 容 器 通常 用 平衡 二 又 树 (通常 是 红 黑 树 ) 实现 。 

关键 字 (K) 的 默认 序 标准 是 std::less<K> ( 见 33.4 节 )。 

类 似 顺 序 容 器 ， 模 板 参 数 A 是 分 配器 ， 容 器 用 它 来 分 配 和 释放 内 存 ( 见 13.6.1 节 和 34.4 
节 )。 对 映射 ，A 的 默认 值 是 std::allocator<std::pair<const K,T>> ( 见 31.4.3 节 )， 对 集合 ， 
A 的 默认 值 是 std::allocator<K>。 


无 序 关 联 容器 (iso.23.5.2 ) 
H 是 哈 希 函数 类 型 ，E 是 相等 性 测试 ; A 是 分 配器 类 型 


unordered_map<K,V,H,E,A> 从 KK 到 V 的 无 序 映射 
unordered_multimap<K,V,H,E,A> 从 K 到 V 的 无 序 映 射 ， 允许 重复 关键 字 
unordered_set<K,H,E,A> K 的 无 序 集合 


unordered_multiset<K,H,E,A> K 的 无 序 集合 ; 允许 重复 关键 字 





这 些 容 器 都 是 采用 溢出 链表 法 的 哈 希 表 实 现 。 关 键 字 类 型 K 的 默认 哈 希 函 数 类 型 H 为 
std::hash<K> ( 见 31.4.3.2 节 )。 关 键 字 类 型 K 的 默认 相等 性 判定 函数 类 型 E 为 std::equal_ 
to<K> ( 见 33.4 节 ); 相等 性 判定 函数 用 来 判断 哈 希 值 相 同 的 两 个 对 象 是 否 相 等 。 

关联 容器 都 是 链接 结构 ( 树 )， 节 点 类 型 为 其 成 员 value_type ( 按 前 文 符号 表示 ， 对 映 
射 是 pair<const K,V> ， 对 集合 是 K)。set、map 或 multimap 的 元 素 序列 都 按 关键 字 值 (K) 
排序 。 无 序 容器 则 不 需要 一 个 序 关 系 (如 <) 来 排序 其 元 素 ， 而 是 采用 哈 希 函数 来 访问 元 素 
( 见 31.2.2.1 节 )。 因 此 ， 无 序 容 器 的 元 素 序 列 都 不 保证 顺序 。multimap 与 map 的 不 同 之 处 
是 一 个 关键 字 值 可 以 出 现 多 次 。 

容器 适配器 是 一 类 特殊 容器 ， 它 们 为 其 他 容器 提供 了 特殊 的 接口 。 


容器 适配器 
C 是 一 个 容器 类 型 
priority_ queue<TC,Cmp> T 的 优先 队列 ; Cmp 是 优先 级 函数 类 型 
queue<T,C> TT 的 队列 ， 支 持 push() 和 pop() 操作 
stack<T,C> T 的 栈 ,支持 push() 和 pop() 操作 


一 个 priority_queue 的 默认 优先 级 函数 Cmp 为 std::less<T>。queue 的 默认 容器 类 型 C 为 
std::deque<T> ，stack 和 priority_queue 的 默认 容器 类 型 C 为 std::vector<T> ， 见 31.5 节 。 

某 些 数据 类 型 具有 标准 容器 所 应 有 的 大 部 分 特性 ， 但 又 非 全 部 。 我 们 有 时 称 这 些 数据 类 
型 为 “ 拟 容器 ”。 一 些 最 有 趣 的 拟 容器 如 下 表 所 示 。 


拟 容器 
TIN] 固定 大 小 的 内 置 数组 : N 个 连续 存储 的 类 型 为 T 的 元 素 ; 没有 size() 或 其 他 成 员 函 数 
array<T,N> 固定 大 小 的 数组 ，N 个 连续 存储 的 类 型 为 T 的 元 素 ; 类 似 内 置 数组 ， 但 解决 了 大 部 


分 问题 
basic_string<C,TrA> 一 个 连续 分 配 空间 的 类 型 为 C 的 字符 序列 ， 支 持 文本 处 理 操 作 ， 如 连接 (+ 和 +=) ; 
basic_string 通常 都 经 过 了 优化 ， 短 字符 串 无 须 使 用 自由 存储 空间 ( 见 19.3.3 节 ) 

















string basic_string<char> 

ui16string basic_string<char16_t> 

U32string basic_string<char32_t> 

wstring basic_string<wchar_t> 

valarray<T> 数值 向 量 ， 支 持 向 量 运算 ， 但 有 一 些 限 制 ， 这 些 限制 是 为 了 鼓励 高 性 能 实现 ; 只 在 
做 大 量 向 量 运算 时 使 用 

bitset<N> N 个 二 进 制 位 的 集合 ， 支 持 集合 操作 ， 如 & 和 | 

vector<bool> vector<T> 的 特例 化 版 本 ， 紧 凑 保 存 二 进 制 位 


对 basic_string，A 是 其 分 配器 ( 见 34.4 )，Tr 是 字符 萃取 ( 见 36.2.2 节 )。 

如 果 可 以 选择 的 话 ， 应 该 优先 选择 vector、string 或 array 这 样 的 容器 ， 而 不 是 内 置 数 
组 。 内 置 数 组 有 两 个 问题 一 一 数组 到 指针 的 隐 式 类 型 转换 和 必须 要 记 住 大 小 ， 它 们 都 是 错误 
的 主要 来 源 (如 27.2.1 节 中 所 述 )。 

还 应 该 优先 选择 标准 字符 串 ， 而 不 是 其 他 字符 串 或 C 风格 字符 串 。C 风格 字符 串 的 指 
针 语义 意味 着 笨拙 的 符号 表示 和 程序 员 的 额外 工作 ， 它 也 是 主要 错误 来 源 之 一 (如 内 存 泄漏 ) 
( 见 36.3.1 节 )。 
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31.2.1 容器 表示 


C++ 标准 并 未 给 标准 容器 规定 特定 的 表示 形式 ， 而 是 指明 了 容器 接口 和 一 些 复杂 性 要 
求 。 实 现 者 会 选择 适当 的 (通常 也 是 巧妙 优化 过 的 ) 实现 方法 来 满足 一 般 要 求 和 常见 用 途 。 
除了 处 理 元 素 所 需 的 一 些 内 容 之 外 ， 这 类 “句柄 ”还 会 持 有 一 个 分 配器 ( 见 34.4 节 )。 

对 于 一 个 vector， 其 元 素 的 数据 结构 很 可 能 是 一 个 数组 : 


vector 会 保存 指向 一 个 元 素数 组 的 指针 ， 还 会 保存 元 素数 目 和 向 量 容 量 (已 分 配 的 和 尚未 使 
用 的 位 置 数 ) 或 等 价 的 一 些 信息 ( 见 13.6 节 )。 
list 很 可 能 表示 为 一 个 指向 元 素 的 链接 序列 以 及 元 素数 目 : 


list: 











forward_list 很 可 能 表示 为 一 个 指向 元 素 的 链接 序列 : 
forward_list: 
map 很 可 能 实现 为 一 棵 (平衡 ) 树 ， 树 结 点 指向 〈 键 , 值 ) 对 : 








string 的 实现 可 能 如 19.3 节 和 23.2 节 所 勾勒 的 基本 思路 ; 即 ， 短 string 的 字符 保存 在 string 
句柄 内 ， 而 长 string 的 元 素 则 保存 在 自由 存储 空间 中 的 连续 区 域 (类 似 vector 的 元 素 )。 类 
似 vector， 一 个 string 也 会 预 留 “ 空 闲 空间 ， 以 便 扩 张 时 不 必 频 繁 地 重新 分 配 空间 。 
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string: 数目 N 
| 字符 | 空闲 室 间 | 


te ho cll 














类 似 内 置 数 组 ( 见 7.3 节 )，array 就 是 一 个 简单 的 元 素 序列 ， 无 句柄 : 





array: 元 素 


这 意味 着 一 个 局 部 array 不 会 使 用 任何 自由 存储 空间 (除非 它 本 身 是 在 自由 存储 空间 中 分 配 
的 )， 而 且 一 个 类 的 array 成 员 也 不 会 悄悄 带 来 任何 自由 存储 空间 操作 。 


31.2.2 ”对 元 素 的 要 求 


若 想 作 为 一 个 容器 的 元 素 ， 对 象 类 型 必须 允许 容器 拷贝 、 移 动 以 及 交换 元 素 。 如 果 容 
器 使 用 拷贝 构造 函数 或 拷贝 赋值 操作 拷贝 一 个 元 素 ， 拷 贝 的 结果 必须 是 一 个 等 价 的 对 象 。 这 
大 致意 味 着 任何 对 象 值 相等 性 检测 都 必须 得 到 副本 和 原 值 相等 的 结论 。 换 名 话说， 元 素 拷贝 
必须 能 像 int 的 普通 拷贝 一 样 正常 工作 。 类 似 地 ， 移 动 构造 函数 和 移动 赋值 操作 也 必须 具有 
常规 定义 和 常规 移动 语义 ( 见 17.5.1 节 )。 此 外 ， 元 素 类 型 还 必须 允许 按 常 规 语义 交换 元 素 。 
如 果 一 个 类 型 定义 了 拷贝 或 移动 操作 ， 则 标准 库 swap() 就 能 正常 工作 。 

对 元 素 类 型 的 要 求 的 细节 散布 在 C++ 标准 中 ， 很 难 阅读 ( 见 iso.23.2.3、iso.23.2.1 和 
iso.17.6.3.2 )， 但 基本 上 ， 如 果 一 个 类 型 具有 常规 的 拷贝 或 移动 操作 ， 容 器 就 能 保存 该 类 型 
元 素 。 只 要 满足 容器 元 素 的 基本 要 求 和 算法 的 特定 要 求 (如 元 素 有 序 ， 见 31.2.2.1 节 )， 很 多 
基本 算法 ， 如 copy() 、find() 和 sort()， 都 能 正常 运行 。 

一 些 违反 标准 容器 规则 要 求 的 情况 能 被 编译 器 检查 出 来 ， 但 对 其 他 一 些 问题 编译 器 则 无 
能 为 力 ， 从 而 导致 意料 之 外 的 行为 。 例 如 ， 一 个 赋值 操作 出 错 ， 抛 出 一 个 异常 ， 留 下 一 个 只 
拷贝 了 部 分 内 容 的 元 素 。 这 是 一 个 糟糕 的 设计 ( 见 13.6.1 节 )， 会 违反 C++ 标准 中 “提供 基 
本 保证 ”( 见 13.2 节 ) 的 原则 。 一 个 处 于 非法 状态 的 元 素 稍 后 可 能 会 导致 一 场 灾难 。 

当 无 法 拷贝 对 象 时 ,一 个 替换 方案 是 将 对 象 指 针 而 不 是 对 象 本 身 保存 在 容器 中 。 最 
典型 的 例子 就 是 多 态 类 型 ( 见 3.2.2 节 和 20.3.2 节 )。 例 如 ， 我们 使 用 vector<unique_ 
ptr<Shape>> 或 vector<Shape*> 而 不 是 vector<Shape> 来 保证 多 态 行为 。 
31.2.2.1 ”比较 操作 

关联 容器 要 求 其 元 素 能 够 排序 ， 很 多 可 以 应 用 于 容器 的 操作 也 有 此 要 求 (如 sort() 和 
merge())。 默 认 情 况 下 ，< 运算 符 被 用 来 定义 序 。 如 果 < 不 合适 ,程序 员 必 须 提供 一 个 替代 
操作 ( 见 31.4.3 节 和 33.4 节 )。 排 序 标准 必须 定义 一 个 严格 弱 序 (strict weak ordering)。 形 
式 化 地 描述 ， 即 小 于 和 相等 关系 (如 果 定 义 了 的 话 ) 都 必须 是 传递 的 。 也 就 是 说 ， 一 个 排序 
标准 cmp (将 它 想象 为 “小 于 ”) 必须 满足 : 

[1] 反 自 反 性 : cmp(x,x) 为 false。 

[2] 反对 称 性 : cmp(x,y) 意味 着 !cmp(x,y)。 

[3] 传递 性 : 若 cmp(x,y) 且 cmp(yz)， 则 cmp(x,z)。 

[4] 相等 的 传递 性 : 定义 equiv(xy) 为 Kecmp(xy)jllcmp(yx))。 若 equiv(x,y) 且 equiv(y,z)， 

则 equiv(x,z)。 
在 需要 == 时 ， 最 后 一 条 规则 允许 我 们 将 相等 判定 (x==y) 定义 为 KKcmp(x,y)llcmp(y,x))。 





要 求 一 个 比较 标准 的 标准 库 操作 都 提供 两 个 版 本 。 例 如 : 


template<typename Ran> 

void sort(Ran first, Ran last); /用 < 进行 比较 
template<typename Ran, typename Cmp> 

void sort(Ran first, Ran last, Cmp cmp); // 用 cmp 进行 比较 


第 一 个 版 本 用 < 进行 比较 ， 第 二 个 版 本 则 使 用 用 户 提供 的 比较 操作 cmp。 例 如 ， 我 们 可 能 
决定 用 一 个 大 小 写 不 敏感 的 比较 操作 来 排序 fruit。 为 此 ， 我 们 可 以 定义 一 个 函数 对 象 ( 见 
3.4.3 节 和 19.2.2 节 )， 调 用 该 谓词 完成 一 对 string 的 比较 : 


class Nocase { /大 小 写 不 敏感 的 字符 串 比较 
public: 
bool operator()(const string&, const string&) const; 


}; 


bool Nocase::operator()(const string& x, const string& y) const 


// 若 x 字典 序 上 小 于 y， 则 返回 true， 不 考虑 大 小 写 


{ 
auto p = x.begin(); 
auto q = ybegin(); 
while (p!=x.end() && q!=y.end() && toupper(*p)==toupper(*9q)) { 
++p; 
t++q; 
} 
if (p == x.end()) return q 1= yend(); 
if (q == yend()) return false; 
return toupper(*p) < toupper(*q); 
} 
我 们 可 以 用 这 个 比较 操作 来 调用 sort()。 考 虑 下 面 的 例子 : 
fruit: 


apple pear Apple Pear lemon 


用 sort(fruit.begin(),fruit.end(),Nocase()) 进行 排序 会 得 到 下 面 的 结果 : 
fruit: 
Apple apple lemon Pear pear 
假定 某 个 字符 集中 大 写字 母 排 在 小 写字 母 之 前 ， 普 通 的 sort(fruit.begin(),fruit.end()) 则 会 得 到 : 


fruit: 
Apple Pear apple lemon pear 


注意 ，C 风格 字符 串 ( 即 const char*) 上 的 < 比较 的 是 指针 值 ( 见 7.4 节 )。 因 此 ， 如 果 用 C 
风格 字符 串 作 为 关键 字 ， 关 联 容器 将 不 能 正常 工作 ， 这 出 乎 大 多 数 人 的 预料 。 为 了 让 这 样 的 
关联 容器 正常 工作 ， 就 必须 使 用 基于 字典 序 的 比较 操作 。 例 如 : 


struct Cstring_less { 
bool operator()(const char* p, const char* q) const { return strcmp(p,q)<0; } 





}; 
map<char:,int,Cstring_less> m; /map 使 用 stremp() 比较 const char* 


31.2.2.2 ”其 他 关系 运算 符 

默认 情况 下 ， 容 器 和 算法 在 需要 进行 小 于 比较 时 会 使 用 <。 若 此 默认 比较 操作 不 正确 ， 
程序 员 可 以 提供 一 个 自 定义 的 比较 操作 。 但 是 ， 标 准 库 并 未 提供 传递 等 价 性 检验 操作 的 机 
制 ， 而 是 在 程序 员 提 供 了 比较 操作 cmp 时 ， 用 两 次 比较 进行 等 价 性 检验 。 例 如 : 
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if (x == y) 咱 若 用 户 提供 了 比较 操作 ， 不 采用 这 种 方式 

if (tcmp(x,y) && Icmp(y,x)) ”1 若 用 户 提 供 了 一 个 比较 操作 cmp， 采 用 这 种 方式 
采用 这 种 机 制 ， 用 户 就 不 必 为 每 种 关联 容器 值 类 型 或 是 使 用 比较 操作 的 算法 都 提供 等 价 性 检 
验 操作 。 这 种 方式 可 能 看 起 来 代价 较 高 ， 但 标准 库 不 会 频繁 进行 等 价 性 检验 ， 而 且 50% 的 
情况 下 只 需 进行 一 次 cmp() 调用 ， 通 常 编译 器 会 优化 掉 双重 cmp()。 

使 用 由 小 于 比较 (默认 是 <) 定义 的 等 价 关系 而 不 是 使 用 直接 的 相等 比较 (默认 是 == 
还 有 其 他 实际 用 途 。 例 如 ， 关 联 容器 ( 见 31.4.3 节 ) 用 等 价 性 检验 lcmp(x,y) && !cmp(yx) 
来 比较 关键 字 。 这 意味 着 等 价 的 关键 字 不 必 是 相同 的 值 。 例 如 ， 一 个 multimap( 见 31.4.3 节 ) 
用 大 小 写 不 敏感 的 比较 操作 作为 其 比较 标准 ， 则 字符 串 Last、last、IAst、laSt 和 lasT 都 是 
等 价 的 ， 虽 然 相等 比较 运算 符 == 认为 它们 是 不 同 的 字符 串 。 这 种 机 制 允 许 我 们 在 排序 时 急 
略 我 们 认为 不 重要 的 差异 。 

如 果 相 等 比较 (默认 是 ==) 总 是 给 出 与 等 价 性 检验 Icmp(x,y) && !cmp(yx) (cmp() 默 
认为 <) 相同 的 结果 ， 我 们 称 值 集合 具有 全 序 (total order ) 。 

给 定 < 和 ==， 我 们 可 以 简单 地 构造 其 他 常用 的 比较 操作 。 标 准 库 将 它们 定义 在 命名 空 
间 std::rel_ops 中 ， 头 文件 <utility> 呈现 了 这 些 定义 ( 见 35.5.3 节 )。 


31.3 ”操作 概览 
标准 容器 提供 的 操作 和 类 型 可 以 概括 如 下 : 


容器 : 





value_type,size_type,difference_type,pointer,const_pointer,reference,const_reference 
iterator,const_iterator, ?reverse_iterator, ?const_reverse_ iterator,allocator_type 
begin(),end!(),cbegin(),cend!(), ?rbegin(), ?rend(), ?crbegin(), ?crend(),=,==,!= 


swap!(), ?size(),max_size(),empty(),clear(),get_allocator(),constructors,destructor 
?2<, ?<=, ?>, ?>=, ?insert(), ?2emplace(), ?erase() 








顺序 容器 : 关联 容器 : 


assign(),front(),resize() 
?back(), ?push_back() 
?pop_back(), "emplace_back() 





key_type,mapped_type, ?[], ?at() 
lower_bound(),upper_bound() equal_range() 
find(),count(),emplace_hint() 


有 序 容器 : A 
Dat() 


shrink_to_fit() key_compare key_equal(),hasher 
key_comp() hash_function() 
value_comp() key_equal() 


桶 接口 































push_front(),pop_front() 
emplace_front() 


























remove() 
remove_if(),unique() datal() 

merge(),sort() capacity() 

reverse() reservel() 









deque 











unordered! set 





splice() insert_after(),erase_after() 
empiace_after(),splice_after() 





multiset 
unordered!| multimap 











list 
forward_list unordered_multiset 








在 这 里 箭头 表示 为 一 个 容器 提供 了 一 组 操作 ， 不 是 继承 的 含义 。 问 号 (?) 是 一 种 简化 表示 : 
一 些 操 作 只 为 某 些 容器 提供 。 特 别 是 : 

e multi* 系列 关联 容器 或 集合 不 提供 中 或 at()。 

e forward_list 不 提供 insert() 、erase() 或 emplace()， 而 是 提供 * after 系列 操作 。 

e forward_list 不 提供 back()、push_back()、pop_back() 或 emplace_back()。 

e forward_ list 不 提供 reverse_iterator、const_reverse iterator 、rbegin()、rend()、crbegin()、 

crend() 或 size()。 

e unordered_* 系列 关联 容器 不 提供 <、<=、> 或 >=。 
在 上 图 中 [和 at() 操作 出 现 了 多 次 ， 这 只 是 为 了 减少 箭头 的 数目 。 

桶 接口 将 在 31.4.3.2 节 中 介绍 。 

如 果 有 意义 ,访问 操作 都 会 提供 两 个 版 本 : 一 个 用 于 const 对 象 ， 另 一 个 用 于 非 const 
对 象 。 

标准 库 操 作 都 有 复杂 性 保证 。 





标准 容器 操作 复杂 性 

0 列表 头 部 尾部 迭代 器 

30:2 沟 于 31.3.7 涯 31.4.2 节 31.3.6 节 33.12 区 
vector 常量 O(n)+ 常量 + 随机 
list 常量 常量 常量 双向 
forward_list 常量 常量 前 向 
deque 常量 O(n) 常量 常量 随机 
stack 常量 
queue 常量 常量 
priority_queue O(log(n)) O(log(n)) 
map O(log(n)) O(log(n))+ 双向 
multimap O(log(n))+ 双向 
set O(log(n))+ 双向 
multiset O(log(n))+ 双向 
unordered_map 常量 + 常量 + 前 向 
unordered_multimap 常量 二 前 向 
unordered _set 常量 + 前 向 
unordered_multiset 常量 + 前 向 
string 常量 O(n)+ O(m+ 常量 + 随机 
array 常量 随机 
内 置 数组 常量 随机 
valarray 常量 随机 
bitset 常量 





“ 头 部 ”操作 表示 在 第 一 个 元 素 之 前 的 插入 和 删除 操作 。 类 似 地 ,“ 尾 部 ”操作 是 在 最 后 一 个 
元 素 之 后 的 插入 和 删除 操作 ,“ 列 表 ” 操 作 是 在 任意 位 置 的 插入 和 删除 操作 。 
在 选 代 器 这 列 ,“ 随 机 ”表示 “随机 访问 迭代 器 ",“ 前 向 ”表示 “前 向 迭代 器 ",，“ 双 向 ” 
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表示 “双向 迭代 器 ”( 见 33.1.4 节 )。 

其 他 表 项 都 是 对 操作 效率 的 评价 。“ 常 量 ” 表 示 操 作 花 费 的 时 间 不 依赖 于 容器 中 的 元 素 
数目 ; 常量 时 间 (constant time) 的 另 一 种 常见 表示 方式 是 O(1)。O(n) 表示 操作 花费 的 时 间 
与 元 素数 目 成 正比 。 后 缀 + 表示 在 极 少数 情况 下 代价 会 有 大 幅 上 升 。 例 如 ， 向 一 个 list 插 入 
一 个 元 素 需 要 常量 时 间 (因此 对 应 表 项 是 “常量 ” )， 而 vector 上 的 相同 操作 则 需 移动 插入 点 
之 后 的 元 素 (因此 对 应 表 项 是 O(n))。 但 极 少数 情况 下 ， 需 要 为 vector 中 的 所 有 元 素 重新 分 
配 空 间 (因此 我 加 了 后 级 +)。“ 大 OO” 符号 是 表示 复杂 性 的 常规 方式 。 我 添加 + 是 为 了 方便 
那些 除了 平均 性 能 外 还 关心 程序 执行 可 预测 性 的 程序 员 。O(n)+ 的 习惯 术语 是 挫 还 线性 时 间 
(amortized linear time ) 。 

如 果 常 量 值 很 大 ， 常 量 时 间 当 然 可 能 比 线性 时 间 代 价 更 高 。 但 对 于 大 数据 结构 而 言 ， 常 
量 时 间 通 常 意味 着 “代价 低 "，O(n) 意味 着 “代价 高 "， 而 O(log(n)) 意味 着 “代价 较 低 ”。 
即使 是 对 中 等 大 小 的 n，2 的 对 数 O(log(n)) 也 明显 更 接近 常量 时 间 而 非 O(n)。 例 如 : 


对 数 的 例子 
n 16 128 1 024 16 384 1 048 576 
log(n) 4 10 14 20 
n*n 256 802 816 1 048 576 268 435 456 1.1e+12 


关心 运行 代价 的 人 一 定 要 仔细 看 看 这 个 表 。 特 别 是 ， 必 须 理解 哪些 元 素 被 统计 进 n。 但 是 ， 
此 表 所 传递 的 信息 还 是 很 清晰 的 : 不 要 在 n 值 很 大 时 使 用 平方 时 间 的 算法 。 

复杂 性 和 代价 的 评价 给 出 的 都 是 上 界 。 评 价 的 目的 是 给 用 户 一 些 指导 : 他 们 可 以 期 待 程 
序 具 有 怎样 的 性 能 。 自 然 ， 实 现 者 会 尽力 优化 重要 的 程序 。 

注意 ,“ 大 0” 复杂 性 评价 描述 的 是 渐进 特性 ; 即 ， 只 有 当 元 素数 目 非 常 大 时 ， 复 杂 性 
的 差异 才 会 体现 出 来 。 其 他 一 些 因 素 ， 如 单一 操作 的 代价 ， 也 可 能 主导 实际 运行 代价 。 例 
如 ， 遍 历 一 个 vector 和 遍历 一 个 list 的 复杂 性 都 是 O(n)。 但 在 现代 计算 机 体系 结构 上 ， 通 
过 一 个 链接 获取 下 一 个 元 素 (list 中 的 情形 ) 的 代价 会 远 高 于 在 一 个 vector 中 获取 下 一 个 元 
素 的 代价 (元素 是 连续 存储 的 )。 类 似 地 ， 元 素数 目 增加 10 倍 ， 线 性 时 间 算 法 的 实际 运行 时 
间 增 加 可 能 远大 于 10 倍 ， 也 可 能 远 小 于 10 倍 ， 这 取决 于 内 存 和 处 理 器 架构 的 细节 。 因 此 ， 
不 要 简单 地 相信 你 对 代价 的 直觉 以 及 你 对 复杂 性 的 评价 ， 而 要 进行 实际 测试 。 幸 运 的 是 ， 容 
器 的 接口 非常 相似 ， 因 此 很 容易 编写 比较 性 能 的 程序 。 

所 有 容器 的 size() 操作 都 是 常量 时 间 的 。 注 意 ，forward_list 没有 size() 操作 ， 你 如 果 
需要 知道 元 素数 目 ， 就 必须 自己 计数 (代价 为 O(n))。forward_list 为 了 优化 空间 占用 没有 
保存 大 小 或 是 指向 元 素 的 指针 (因此 没有 常量 时 间 的 size() 操作 )。 

上 表 中 string 的 复杂 性 都 是 针对 长 字符 串 估 计 的 。“ 短 字符 串 优化 ”( 见 19.3.3 节 ) 令 所 
有 短 字 符 串 (如 小 于 14 个 字符 的 字符 串 ) 的 操作 都 是 常量 时 间 。 

stack 和 queue 的 复杂 性 反映 了 用 deque 作为 底层 容器 默认 实现 stack( 见 31.5.1 节 和 
31.5.2 节 ) 的 代价 。 


31.3.1 成 员 类 型 
每 个 容器 都 定义 了 如 下 一 组 成 员 类 型 。 





成 员 类 型 (iso.23.2 和 iso.23.3.6.1 ) 


value_type 
allocator_type 
Size_type 
difference_type 
iterator 
const_iterator 
reverse_iterator 
const_reverse_iterator 
reference 
const_reference 
pointer 
const_pointer 
key_type 
mapped_type 
key_compare 





hasher 

key_euqal 
local_iterator 
const_local_iterator 


元 素 类 型 

内 存 管理 器 类 型 

容器 下 标 、 元 素数 目 等 的 无 符号 类 型 
迭代 器 差异 的 带 符号 类 型 

行为 类 似 value_type* 

行为 类 似 const_value_typer* 
行为 类 似 value_type* 

行为 类 似 const_value_type* 
value_type& 

const_value_type& 

行为 类 似 value_type* 

行为 类 似 const_value_type* 
关键 字 类 型 ; 仅 关 联 容器 具有 
映射 值 类 型 ; 仅 关联 容器 具有 

比较 标准 类 型 ; 仅 有 序 容 器 具有 

哈 希 函数 类 型 ; 仅 无 序 容 器 具有 
等 价 性 检验 函数 类 型 ; 仅 无 序 容 器 具有 
桶 和 迭代 器 类 型 ; 仅 无 序 容 器 具有 

桶 迭代 器 类 型 ; 仅 无 序 容器 具有 


每 个 容器 和 “ 拟 容器 ”都 提供 了 上 表 中 的 大 多 数 成 员 类 型 ， 但 不 会 提供 无 意义 的 类 型 。 例 
如 ，array 没有 allocator_ type，vector 没有 key_type。 


31.3.2 构造 函数 、 析 构 函 数 和 赋值 操作 


容器 提供 了 多 种 构造 函数 和 赋值 操作 。 对 一 个 名 为 C 的 容器 (如 vector<double> 或 


map<string,int>)， 我 们 有 : 


构造 函数 、 析 构 函 数 和 赋值 操作 


C 是 一 个 容器 ; 默认 情况 下 ，C 使 用 分 配器 C::allocator_type{ } 


用 elem 初始 化 c; 若 C 有 一 个 初始 化 器 列表 构造 函数 ， 优 先 使 用 它 ; 否则 ， 使 用 其 他 构造 函数 


cect); 默认 构造 函数 : c 是 一 个 空 容器 

C c {ali 默认 构造 c; 使 用 分 配器 a 

C c(n); c 初始 化 为 n 个 元 素 ， 元 素 值 为 value_type{ }; 关联 容器 不 适用 
C c(n,x); c 初 始 化 为 x 的 nn 个 拷贝 ; 关联 容器 不 适用 

C c(n,x,a); c 初始 化 为 x 的 n 个 拷贝 ; 使 用 分 配器 a; 关联 容器 不 适用 

Cc {elem}; 

Cc {c2}; 拷贝 构造 聘 数 ; 将 c2 的 元 素 和 分 配器 拷贝 人 Cc 


Cc {move(c2)}; 
Cc {{elem},a}; 


移动 构造 函数 ; 将 c2 的 元 素 和 分 配器 移入 c 
用 initializer_list {elem} 初始 化 c; 使 用 分 配器 a 


Cc {b,e}; 用 [b:e) 中 的 元 素 初 始 化 c 

Cc {b,e ,al; 用 [b:e) 中 的 元 素 初 始 化 c; 使 用 分 配器 a 
c.“C() 析 构 函数 : 销毁 c 的 元 素 并 释放 资源 
C2=c 拷贝 赋值 : 将 c 的 元 素 拷贝 人 c2 


c2=move(c) 


移动 赋值 : 将 c 的 元 素 移 人 c2 





构造 函数 、 析 构 函 数 和 赋值 操作 
C 是 一 个 容器 ; 默认 情况 下 ，C 使 用 分 配器 C::allocator_ type{ } 
c={elem} 将 initializer_list {elem} 中 的 元 素 赋 予 c 
c.assign(n,x) 将 x 的 n 个 拷贝 赋予 c; 关联 容器 不 适用 
c.assign(b,e) 将 [b:e) 中 的 元 素 赋 予 c 
c.assign({elem}) ”将 initializer_list {elem} 中 的 元 素 赋 予 c 





关联 容器 的 其 他 构造 函数 将 在 31.4.3 节 中 介绍 。 

注意 ， 赋 值 操 作 并 不 拷贝 或 移动 分 配器 ， 目 标 容 器 获得 了 一 组 新 的 元 素 ， 但 会 保留 
其 旧 分 配器 ， 新 元 素 (如 果 有 的 话 ) 的 空间 也 是 用 此 分 配器 分 配 的 。 分 配器 将 在 34.4 节 中 
介绍 。 

记 住 ， 一 个 构造 函数 或 是 一 次 元 素 拷 贝 可 能 会 抛 出 异常 ， 来 指出 它 无 法 完成 这 个 任务 。 

我 们 在 11.3.3 节 和 17.3.4.1 节 中 已 经 讨论 了 初始 化 器 的 潜在 二 义 性 。 例 如 : 


void usel() 

{ 
vector<int> vi {1,3,5,7,9}; 11 Vector 初始 化 为 5 个 整数 
vector<string> vs{7); /1 vector 初始 化 为 7 个 空 字符 串 


vector<int> vi2; 
vi2 = {2,4,6,8}; 儿 将 4 个 整数 赋予 vi2 
vi2.assign(&vi[1],&vi[4]); 几 将 序列 3,5,7 赋予 vi2 


vector<string> vs2; 
vs2 = {"The Eagle", "The Bird and Baby"); 儿 赋予 vs2 两 个 字符 串 
vs2.assign("The Bear", "The Bull and Vet"); 儿 运行 时 错误 


} 
向 vs2 赋值 时 发 生 的 错误 是 传递 了 一 对 指针 (而 不 是 一 个 initializer_list)， 而 两 个 指针 并 非 
指向 相同 的 数组 。 记 住 ， 对 大 小 初始 化 器 使 用 ()， 而 对 其 他 所 有 初始 化 器 都 使 用 {}。 

容器 通常 都 很 大 ， 因 此 我 们 几乎 总 是 以 引用 方式 传递 容器 实 参 。 但 是 ， 由 于 容器 是 资源 
句柄 ( 见 31.2.1 节 )， 我们 可 以 高 效 地 以 返回 值 的 方式 返回 容器 ( 隐 含 使 用 移动 操作 )。 类 似 
地 ， 当 我 们 不 想 用 别名 的 时 候 ， 可 以 用 移动 方式 传递 容器 实 参 。 例 如 : 


void task(vector<int>&& v); 


vector<int> user(vector<int>& large) 


{ 
vector<int> res; 
/1 
task(move(large)); /将 数据 的 所 有 权 传 递 给 task() 
| 
return res; 
} 


31.3.3 ”大 小 和 容量 
大 小 是 指 容 器 中 的 元 素数 目 ; 容量 是 指 在 重新 分 配 更 多 内 存 之 前 容器 能 够 保存 的 元 素 
数目 








大 小 和 容量 
x=c.size() x 是 c 的 元 素数 目 
c.empty() C 为 空 吗 ? 
x=c.max_size() x 是 c 的 最 大 可 能 元 素数 目 
x=c.capacity() x 是 为 c 分配 的 空间 大 小 ; 只 适用 于 vector 和 string 
c.reserve(n) 为 c 预 留 n 个 元 素 的 空间 ; 只 适用 于 vector 和 string 
c.resize(n) 将 c 的 大 小 改变 为 n; 将 增加 的 元 素 初 始 化 为 默认 元 素 值 ; 只 适用 于 顺序 容器 (和 string ) 
c.resize(n,v) 将 c 的 大 小 改变 为 n; 将 增加 的 元 素 初始 化 为 v; 只 适用 于 顺序 容器 (和 string) 


c.shrink_to_fit() 令 c.capacity() 等 于 c.size(); 只 适用 于 vector、deque 和 string 
c.clear() 删除 c 的 所 有 元 素 


在 改变 大 小 或 容量 时 ， 元素 可 能 会 被 移动 到 新 的 存储 位 置 。 这 意味 着 指向 元 素 的 迭代 器 (以 
及 指针 和 引用 ) 可 能 会 失效 ( 即 ， 指 向 旧 元 素 的 位 置 )。 具 体 示例 请 见 31.4.1.1 节 。 

指向 关联 容器 (如 map) 元 素 的 迭代 器 只 有 当 所 指 元 素 从 容器 中 删除 (erase()， 见 
31.3.7 节 ) 时 才 会 失效 。 与 之 相反 ， 指 向 顺序 容器 (如 vector) 元 素 的 迭代 器 当 元 素 重 新 分 
配 空 间 (如 resize()、reverse() 或 push_back()) 或 所 指 元 素 在 容器 中 移动 (如 在 前 一 个 位 
置 进行 erase() 或 insert()) 时 也 会 失效 。 

我 们 很 容易 认为 reserve() 会 提高 性 能 ， 但 vector 的 标准 增长 策略 ( 见 31.4.1.1 节 ) 非 
党 高效 ， 因 此 性 能 问题 很 难 成 为 使 用 reserve() 的 好 理由 。 相 反 ， 我 们 应 该 将 它 看 作 一 种 提 
高 性 能 可 预测 性 和 避免 迭代 器 失效 的 方式 。 


31.3.4 和 迭代 器 


容器 可 以 看 作 按 容器 迭代 器 定义 的 顺序 或 相反 的 顺序 排列 的 元 素 序列 。 对 一 个 关联 容 
器 ， 元 素 的 序 由 容器 比较 标准 (默认 为 <) 决定 : 





迭代 器 
p=c.begin() p 指向 c 的 首 元 素 
p=c.end() p 指向 c 的 尾 后 元 素 
cp=c.cbegin() p 指向 c 的 首 元 素 ， 常量 迭代 咒 
p=c.cend() p 指向 c 的 尾 后 元 素 ， 常 量 迭 代 器 
p=c.rbegin() p 指向 c 的 反 序 的 首 元 素 
p=c.rend() p 指向 c 的 反 序 的 尾 后 元 素 
p=c.crbegin() p 指向 c 的 反 序 的 首 元 素 ， 常量 迭代 器 
p=c.crend() p 指向 c 的 反 序 的 尾 后 元 素 ， 常 量 迭 代 咒 


元 素 遍 历 的 最 常见 形式 是 从 头 至 尾 遍 历 一 个 容器 。 最 简单 的 遍历 方法 是 使 用 范围 for 语句 
( 见 9.5.1 节 )， 它 隐 含 地 使 用 了 begin() 和 end()。 例 如 : 


for (auto& x : v) 川 隐 式 使 用 v.begin() 和 v.end() 
cout << x << \n'; 


当 我 们 需要 了 解 一 个 元 素 在 容器 中 的 位 置 或 需要 同时 引用 多 个 元 素 时 ， 就 要 直接 使 用 迭代 
器 。 在 这 些 情 况 下 ，auto 很 有 用 ， 它 能 帮助 尽量 简化 代码 并 减少 输入 错误 。 例 如 ， 假 定 我 
们 有 一 个 随机 访问 迭代 器 : 


for (auto p = vbegin(); pl!=end(); ++p) { 
if (pl=v.begin() && *(p-1)==*p) 
cout << "duplicate "<< *p << \n'; 


} 
若 不 需要 修改 元 素 ，cbegin() 和 cend() 更 适合 。 即 ， 应 该 这 样 编写 代码 : 
for (auto p = vcbegin(); p!=cend(); ++p) { 儿 使 用 常量 迭代 器 
if (pl=v.cbegin() && *(p-1)==*p) 
cout << "duplicate "<< *p << \n'; 
} 


对 大 多 数 容器 和 大 多 数 C++ 实现 而 言 ， 频 繁 使 用 begin() 和 end() 不 会 产生 性 能 问题 ， 因 此 
我 没有 费力 将 代码 改 为 如 下 复杂 形式 : 


auto beg = vcbegin(); 
auto end = vcend(); 


for (auto p = beg; pl=end; ++p) { 
if (pl!=beg && *(p-1)==*p) 
cout << "duplicate ”<< *p << "\n'; 


} 
31.3.5 ”元素 访问 
一 些 元 素 可 以 直接 访问 : 
元 素 访问 
c.front() 指向 c 的 首 元 素 ; 关联 容器 不 适用 
c.back() 指向 c 的 尾 元 素 ; forward_list 和 关联 容器 不 适用 
ci] 指向 c 的 第 i 个 元 素 ; 不 做 范围 检查 ; 链表 和 关联 容器 不 适用 
c.at(i) 指向 c 的 第 i 个 元 素 ; 若 i 超 出 范围 则 抛 出 一 个 out_of_range; 链表 和 关联 容器 不 适用 
c[k] 指向 c 中 关键 字 为 k 的 元 素 ; 若 未 找到 则 插入 (k, mapped_type 人 {}) ; 只 适用 于 map 和 
unordered_map 

c.at(k) 指向 c 中 关键 字 为 k 的 元素 ; 车 未 找到 则 抛 出 一 个 out_of_range ; 只 适用 于 map 和 


unordered_map 


某 些 C++ 实现 一 一 特别 是 调试 版 本 一 一 总 是 进行 范围 检查 ,但 如 果 考 虑 到 可 移植 性 ， 你 就 
不 能 赁 这 点 来 保证 正确 性 ， 或 是 依赖 于 不 做 范围 检查 来 保证 性 能 。 若 这 些 问 题 很 重要 ， 应 检 
查 你 所 用 的 C++ 实现 。 

关联 容器 map 和 unordered_map 提供 了 接受 关键 字 参 数 而 非 位 置 参数 的 [] 和 at() ( 见 
31.4.3 节 加 


31.3.6” 栈 操作 


标准 vector、deque 和 list (不 包括 forward_list 和 关联 容器 ) 提供 了 高 效 的 元 素 序 列 
尾部 操作 : 


栈 操作 
c.push_back(x) 将 x 添加 到 c 的 尾 元 素 之 后 〈 使 用 拷贝 或 移动 ) 
c.pop_back() 删除 c 的 尾 元 素 


c.emplace_back(args) 用 args 构造 一 个 对 象 ， 将 它 添加 到 c 的 尾 元 素 之 后 





c.push_back(x) 将 x 移动 或 拷贝 人 c， 这 会 将 c 的 大 小 增加 1。 如 果 内 存 耗 尽 或 x 的 拷贝 构 
造 函 数 抛 出 一 个 异常 ,c.push_back(x) 会 失败 。push_back() 失败 不 会 对 容器 造成 任何 影响 ， 
因为 标准 库 操作 都 提供 了 强 保证 ( 见 13.2 节 )。 

注意 ，pop_back() 并 不 返回 值 。 假 如 它 返 回 值 的 话 ， 拷 贝 构造 函数 抛 出 异常 的 情况 就 
会 极 大 地 增加 容器 实现 的 复杂 性 。 

此 外 ，list 和 deque 都 提供 了 类 似 的 在 序列 头 部 的 操作 (31.4.2 节 )，forward_list 也 是 
如 此 。 

如 果 和 希望 实现 容器 动态 增长 ， 同 时 无 需 预 先 分 配 内 存 也 没有 溢出 风险 ,那么 push_ 
back() 是 一 种 常态 选择 ， 不 过 emplace_back() 也 能 实现 类 似 功能 。 例 如 : 


vector<complex<double>> vc; 
for (double re,im; cin>>re>>im; ) ”/ 儿 读 入 两 个 double 
vc.emplace_back(re,im); 儿 将 complex<double>{fre,im} 添加 到 容器 尾部 


31.3.7 ”列表 操作 
标准 容器 提供 了 列表 操作 : 


列表 操作 

q=c.insert(p,x) 将 x 插入 到 p 之 前 ; 使 用 拷贝 或 移动 

q=c.insert(p,n,x) 在 p 之 前 插入 x 的 n 个 拷贝 ; 若 c 是 一 个 关联 容器 ，p 并 非 插 人 位置， 而 是 提 
示 搜 索 开 始 位 置 

q=c.insert(p,first,last) 将 [first:last) 中 的 元 素 插 和 人 到 p 之 前 ; 不 适用 于 关联 容器 

q=c.insert(p,{elem)) 将 initializer_list {elem} 中 的 元 素 插入 到 p 之 前 ; p 提示 从 哪里 开始 搜索 放置 新 
元 素 的 位 置 

q=c.emplace(p,args) 用 args 创建 新 元 素 ， 插 入 到 p 之 前 ; 不 适用 于 关联 容器 

q=c.erase(p) 将 位 于 p 处 的 元 素 从 c 中 删除 

q=c.erase(first,last) 从 c 中 删除 [first:last) 间 的 元 素 

c.clear() 删除 c 中 的 所 有 元 素 


insert() 系列 函数 的 返回 结果 q 指向 插 人 的 最 后 一 个 元 素 。erase() 系列 函数 的 返回 结果 q 指 
向 删除 的 最 后 一 个 元 素 之 后 的 位 置 。 

对 连续 存储 元 素 的 容器 ， 如 vector 和 deque， 插 人 或 删除 一 个 元 素 会 导致 其 他 元 素 移 
动 。 指 向 一 个 移动 的 元 素 的 迭代 器 会 失效 。 一 般 情况 下 ,插入 /删除 点 之 后 的 元 素 会 被 移 
动 ; 若 新 的 大 小 超出 旧 容 量 ， 则 所 有 元 素 都 会 被 移动 。 例 如 : 


vector<int> v {4,3,5,1}; 


auto p = vbegin()+2; 儿 指向 v[2]， 即 指向 5 
v.push_back(6); 中 p 实现 ; v 二 {4,3,5,1,6} 

p= vbegin()+2; 省 指向 v[2]， 即 指向 5 

auto p2 = v.begin()+4; /1 p2 指向 v[4]， 即 指向 6 
v.erase(vbegin()+3); lv 二 {4,3,5,6}; Pp 仍 有 效 ; p2 失效 


任何 向 一 个 向 量 添加 元 素 的 操作 都 可 能 导致 为 全 部 元 素 重新 分 配 存 储 空间 ( 见 13.6.4 节 )。 
如 果 先 创建 一 个 对 象 然后 将 它 拷贝 (或 移动 ) 到 一 个 容器 中 在 符号 表示 上 很 策 拙 或 效率 
很 低 ， 就 轮 到 emplace() 操作 发 挥 作 用 了 。 例 如 : 





void userl(list<pair<string,double>>& ist) 


{ 
auto p = lst.begin(); 
while (pl=lst.end()&& p->first!="Denmark") 川 查找 插入 点 
广 什么 也 不 做 */; 
p=Ist.emplace(p,"England",7.5); /| 优雅 且 精 炼 
=lst.insert(p,make_pair("France",9.8)); 儿 辅助 函数 
p=lst.insert(p,pair<string,double>>f{"Greece",3.14}); 外 元 长 
} 


forward_list 不 提供 迭代 器 指定 位 置 之 前 的 操作 ， 如 insert()。 这 种 操作 无 法 实现 ， 是 因为 
在 一 个 forward_list 中 ， 仅 给 出 一 个 迭代 器 ， 没 有 很 好 的 方法 找到 前 一 个 元 素 。 取 而 代 之 ， 
forward_list 提供 了 和 迭代 器 指定 位 置 之 后 的 操作 ， 如 insert_after()。 类 似 地 ， 无 序 容 器 不 提 
供 “ 普 通 ”emplace()， 而 是 用 emplace_hint() 提供 一 个 提示 。 


31.3.8 ”其 他 操作 


容器 可 以 比较 和 交换 : 
比较 和 交换 

c1==c2 c1 的 所 有 元 素 都 与 c2 的 对 应 元 素 相等 吗 ? 
c1!=c2 !(c1==c2) 
c1<c2 按 字典 序 ，c1 在 c2 之 前 吗 ? 
c1<=c2 !(c2<c1) 
c1>c2 c2<c1 
c1>=c2 !(c1<c2) 
c1.swap(c2) 交换 c1 和 c2 的 值 ; 不 抛 出 异常 
swap(c1,c2) c1.swap(c2) 


当 用 比较 运算 符 (如 <=) 比较 容器 时 ， 会 使 用 由 == 或 < 生成 的 元 素 等 价 比较 运算 符 比 较 元 
素 (如 用 !(b<a) 实现 a>b 的 比较 )。 
swap() 操作 既 交 换 元 素 也 交换 分 配器 。 


31.4 ”容器 
本 节 继 续 深 入 讨论 一 些 细节 : 
e vector 及 其 构造 隐 数 ( 见 31.4.1 节 )。 
e 链表 : list 和 forward list ( 见 31.4.2 节 )。 
@ 关联 容器 ， 如 map 和 unordered_map ( 见 31.4.3 节 )。 


31.4.1 vector 


STL 的 vector 是 默认 容器 一 一 除非 你 有 充分 理由 ， 否 则 应 该 使 用 它 。 如 果 你 希望 使 用 
链表 或 内 置 数 组 替代 vector， 应 慎重 考虑 后 再 做 决定 。 

31.3 节 介 绍 了 vector 上 的 操作 ， 并 隐 含 地 与 其 他 容器 上 的 操作 进行 了 对 比 。 但 是 ， 
了 解 了 vector 的 重要 性 之 后 ， 本 节 继 续 深 入 讨论 它 ， 重 点 介绍 其 操作 是 如 何 实现 的 。 

vector 的 模板 参数 和 成 员 类 型 定义 如 下 : 





template<typename T, typename Allocator = allocator<T>> 
class vector { 
public: 
using reference = value_type&i; 
using const_reference = const value_type&i; 
using iterator = 产 由 具体 实现 定义 */; 
using const_iterator = /* 由 具体 实现 定义 ?ji; 
using size_type =/* 由 具体 实现 定义 站 
using difference_type =/* 由 具体 实现 定义 */; 
using value type =T; 
using aliocator_type = Allocator; 
using pointer = typename allocator traits<Allocator>::pointer; 
using const_pointer = typename allocator traits<Allocator>::const_pointer; 
using reverse_iterator = std::reverse iterator<iterator>; 
Using const_reverse iterator = std::reverse_iterator<const iterator>; 


加 
}; 
31.4.1.1 ” vector 和 增长 
考虑 一 个 vector 对 象 的 内 存 布 局 (如 13.6 市 所 述 ); 


vector: 











使 用 大 小 (元 素数 目 ) 和 容量 (不 重新 分 配 空间 的 前 提 下 可 容纳 的 元 素数 目 ) 令 push_ 
back() 操作 时 的 向 量 增长 相当 高 效 : 不 会 在 添加 每 个 元 素 时 都 分 配 内 存 ， 而 是 在 超出 容量 
时 才 进 行 一 次 重新 分 配 ( 见 13.6 节 )。C++ 标准 并 未 指定 超出 容量 时 向 量 的 增长 幅度 ,但 
很 多 C++ 实现 都 是 增加 大 小 的 一 半 。 曾 经 有 一 段 时 间 ， 当 读 取 输入 存 和 一 个 vector 时 ,我 
总 是 注意 使 用 reserve()。 但 我 惊讶 地 发 现 ， 基 本 上 所 有 情况 下 ,调用 reserve() 都 不 会 带 
来 可 测量 的 性 能 变化 。 默 认 的 增长 策略 与 我 自己 预测 分 配 做 得 一 样 好 ， 因 此 我 就 停止 使 用 
reserve() 来 提高 性 能 了 。 取 而 代 之 ,我 用 它 来 提高 重 分 配 延 迟 的 可 预测 性 以 及 避免 指针 和 
迭代 器 失效 。 

容量 的 概念 令 指 向 vector 元 素 的 迭代 器 只 有 在 真正 发 生 重 分 配 时 才 会 失效 。 考 虑 如 下 
将 字符 读 和 缓冲 并 跟踪 单词 边界 的 程序 : 


vector<char> chars; 儿 字 符 的 输入 “缓冲 ” 
constexpr int max = 20000; 

chars.reserve(max); 

vector<char*> words; 几 指向 单词 开始 位 置 的 指针 





bool in _word = false; 
for (char c; cin.get(c)) { 
if (isalpha(c)) { 
if (lin_word) { 1/ 发现 单词 开始 

in_word = true; 
chars.push_back(0); 川 前 一 个 单词 结束 
chars.push_back(c); 
words.push_back(&chars.back()); 
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else 
chars.push_back(c); 


} 
else 
in_word = false; 


if (in_word) 
chars.push_back(0); 儿 结束 上 一 个 单词 


if (max<chars.size()){ /糟糕 : 字符 数 超出 了 容量 ; 单词 变 为 非法 
/1 


en 1/ 释放 任何 剩余 容量 
假如 这 里 未 使 用 reserve()， 则 在 chars.push_back() 导致 一 次 重 分 配 时 words 中 的 指针 就 
会 失效 。 这 里 “失效 ”的 含义 是 继续 使 用 这 些 指针 会 产生 未 定义 的 行为 。 它 们 可 能 指向 一 个 
元 素 ， 也 可 能 不 ， 但 几乎 肯定 不 再 指向 重 分 配 前 所 指 的 元 素 。 
使 用 push_back() 和 相关 操作 增长 vector 的 能 力 意味 着 没有 必要 再 使 用 底层 C 风格 的 
malloc() 和 realloc() 了 ， 因 为 这 两 个 操作 宛 长 乏味 且 易 错 。 
31.4.1.2 ”vector 和 风 套 
与 其 他 数据 结构 相 比 ,vector( 以 及 类 似 的 连续 存储 元 素 的 数据 结构 ) 有 三 个 主要 优势 : 
e vector 的 元 素 是 紧凑 存储 的 : 所 有 元 素 都 不 存在 额外 的 内 存 开 销 。 类 型 为 
vector<X> 的 vec 的 内 存 消 耗 大 致 为 sizeof(vector<X>)+vec.size()*sizeof(X)。 其 中 
sizeof(vector<X>) 大 约 为 12 个 字 节 ， 对 大 向 量 而 言 是 微不足道 的 。 
e vector 的 遍历 非常 快 。 为 访问 下 一 个 元 素 ， 我 们 不 必 利 用 指针 间接 寻 址 ， 而 且 对 类 
vector 结构 上 的 连续 访问 ， 现 代 计 算 机 都 进行 了 优化 。 这 使 得 vector 元 素 的 线性 扫 
描 (就 像 find() 和 copy() 中 所 做 的 ) 接近 最 优 。 
e vector 支持 简单 且 高 效 的 随机 访问 。 这 使 得 vector 上 的 很 多 算法 (如 sort() 和 
binary_search()) 非常 高 效 。 
我 们 很 容易 低估 这 些 优点 带 来 的 益处 。 例 如 ，list 这 样 的 双向 链表 通常 会 有 每 元 素 四 个 字 
的 额外 内 存 开 销 ( 两 个 链接 加 上 一 个 自由 存储 空间 信息 头 )， 而 且 遍 历 它 的 代价 很 容易 比 遍 
历 包含 相同 数据 的 vector 高 出 一 个 数量 级 。 性 能 差异 可 能 相当 惊人 ， 建 议 你 亲手 测试 一 下 
[Stroustrup,2012a]。 
紧凑 存储 和 高 效 访问 的 优点 可 能 无 意 中 被 妥协 。 考 虑 如 何 表示 二 维和 矩阵 ， 有 两 种 很 明显 
的 解决 方案 : 
e vector 的 vector: vector<vector<double>>。 用 C 风格 的 双重 下 标 访问 : mlil[]。 
e。 特殊 矩阵 类 型 Matrix<2,double> ( 见 第 29 章 )， 连 续 存 储 元 素 (例如 ， 存 储 在 一 个 
vector<double> 中 )， 通 过 一 对 下 标 计 算 元 素 在 vector 中 的 位 置 : m(i,j)。 
一 个 3x4 的 vector<vector<double>> 的 内 存 布 局 如 下 所 示 : 
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Matrix<2,double> 的 内 存 布局 则 如 下 所 示 : 


[TT 


为 构造 vector<vector<double>>， 我 们 需要 调用 四 次 构造 函数 并 进行 四 次 自由 存储 空间 分 
配 操作 。 为 访问 元 素 ， 我 们 需要 做 两 次 间接 寻 址 。 

为 构造 Matrix<2,double> ， 我 们 只 需 调 用 一 次 构造 函数 、 进 行 一 次 自由 存储 空间 分 配 。 
为 访问 元 素 ， 也 只 需 做 一 次 间接 寻 址 。 

当 到 达 某 行 中 的 一 个 元 素 后 ， 为 访问 其 前 驱 元 素 我 们 不 必 再 进行 一 次 间接 访问 ， 因 此 
vector<vector<double>> 的 元 素 访 问 代 价 并 不 总 是 Matrix<2,double> 的 两 倍 。 但 是 对 要 求 
高 性 能 的 算法 而 言 ，vector<vector<double>> 的 链接 结构 所 产生 的 分 配 、 释 放 和 访问 代价 
仍然 是 一 个 问题 。 

vector<vector<double>> 解决 方案 隐 含 了 一 个 可 能 性 : 每 行 的 大 小 可 以 不 同 。 有 些 时 
候 这 的 确 是 一 个 优点 ， 但 大 多 数 情况 下 这 只 是 为 错误 提供 了 机 会 、 为 测试 增加 了 负担 。 

当 我 们 需要 更 高 维 矩 阵 时 ， 上 述 问 题 和 额外 开销 会 变 得 更 严重 : 你 可 以 比较 
vector<vector<vector<double>>> 相对 于 Matrix<3,double> 增加 的 间接 寻 址 和 分 配 操作 次 数 。 

总 之 ,我 注意 到 数据 结构 紧凑 存储 的 重要 性 经 常 被 低估 或 妥协 。 紧 凑 存 储 的 优点 既是 逻 
辑 上 的 也 是 关乎 性 能 的 。 综 合 考虑 它 被 低估 及 指针 和 new 被 过 度 使 用 的 趋势 ， 我 们 现在 面 
临 一 个 广泛 存在 的 问题 。 例 如 ， 考 虑 在 实现 一 个 二 维 结构 时 将 每 行 实现 为 自由 存储 空间 上 的 
独立 对 象 vector<vector<double>*>， 这 会 带 来 开发 复杂 性 、 运 行 时 代价 、 内 存 开销 以 及 错 
误 可 能 等 诸多 问题 。 
31.4.1.3 ”vector 和 数组 

vector 是 一 种 资源 句柄 ， 这 是 允许 改变 大 小 和 实现 高 效 移动 语义 的 原因 。 但是， 这 一 特 
点 偶尔 也 会 变 为 缺点 一 一 尤其 是 与 不 依赖 于 元 素 和 句柄 分 离 存 储 的 数据 结构 (如 内 置 数 组 和 
array) 相 比 。 将 元 素 序 列 保存 在 栈 中 或 另 一 个 对 象 中 可 能 会 带 来 性 能 上 的 优势 ， 就 像 它 也 
可 能 是 劣势 一 样 。 

vector 能 很 好 地 处 理 初 始 化 后 的 对 象 。 这 令 我 们 使 用 vector 变 得 很 简单 并 能 依赖 元 素 
的 恰当 析 构 操作 。 但 是 ， 这 一 特点 偶尔 也 会 变 成 缺点 一 一 尤其 是 与 允许 未 初始 化 元 素 的 数据 
结构 (如 内 置 数 组 和 array) 相 比 。 

例如 ， 在 向 数组 元 素 存 人 数据 之 前 ， 我 们 不 必 初 始 化 它们 : 


void read() 


{ 











array<int,MAX]> a; 
for (auto& x : a) 
cin.get(&x); 
} 
对 vector， 我们 可 以 用 emplace_back() 达到 类 似 效 果 (但 不 必 指 定 一 个 MAX)。 
31.4.1.4 vector 和 string 
vector<char> 是 可 改变 大 小 、 连 续 存 储 的 char 序列 ，string 也 是 如 此 。 那 么 我 们 应 该 
如 何在 两 者 间 进 行 选择 呢 ? 
vector 是 一 种 保存 值 的 通用 机 制 ， 并 不 对 保存 的 值 之 间 的 关系 做 任何 假设 。 对 一 个 
vector<char> 而 言 ， 字 符 串 Hello, World! 只 不 过 是 一 个 13 个 char 类 型 的 元 素 的 序列 而 已 。 








将 它们 排序 为 5HWdellloor (有 一 个 前 级 空格 ) 是 完全 正常 的 。 与 之 相反 ，string 的 设计 目 
的 就 是 保存 字符 序列 ， 它 认为 字符 间 的 关系 是 非常 重要 的 。 因 此 ， 我 们 很 少 会 对 string 中 
的 字符 进行 排序 ， 因 为 这 会 破坏 字符 串 的 含义 。 某 些 string 操作 反映 了 这 一 点 (如 c_str()、 
>> 和 find()“ 知 道 ”C 风格 字符 串 以 0 结束 )。string 的 实现 也 反映 了 对 其 使 用 方式 的 假设 。 
例如 ， 如 果 没 有 我 们 会 大 量 使 用 短 字符 串 这 一 前 提 ， 短 字符 串 优化 ( 见 19.3.3 节 ) 就 是 纯粹 
的 “最 差 化 ”而 非 优 化 ， 而 有 了 这 一 前 提 ， 最 小 化 自由 存储 空间 使 用 就 是 值得 的 了 。 
是 否 应 该 有 “ 短 vector 优化 ” 呢 ? 我 持 怀 疑 态度 ， 但 这 需要 大 量 实际 研究 来 确认 。 


31.4.2 ”链表 


STL 提供 了 两 种 链表 类 型 : 

e list: 双向 链表 

e forward list: 单 向 链表 
list 为 元 素 插 入 和 删除 操作 进行 了 优化 。 当 你 向 一 个 list 插 入 元 素 或 是 从 一 个 list 删除 元 素 
时 ，list 中 其 他 元 素 的 位 置 不 会 受到 影响 。 特 别 是 ， 指 向 其 他 元 素 的 迭代 器 也 不 会 受到 影响 。 

与 vector 相 比 ， 链 表 的 下 标 操作 慢 得 令 人 难以 忍受 ， 因 此 链表 并 不 提供 下 标 操 作 。 如 
果 需 要 的 话 ， 你 可 以 用 advance() 和 类 似 操作 在 链表 中 定位 ( 见 33.1.4 节 )。 我 们 可 以 用 和 迭 
代 器 遍历 链表 : list 提供 了 双向 和 迭代 器 ( 见 33.1.2 节 )，forward list 提供 了 单 向 迭代 器 (这 
类 链表 也 是 因此 得 名 )。 

默认 情况 下 ，list 的 元 素 都 独立 分 配 内 存 空间 ， 而 且 要 保存 指向 前 驱 和 后 继 的 指针 ( 见 
11.2.2 节 )。 与 vector 相 比 ， 每 个 list 元 素 占 用 更 多 内 存 空 间 (通常 每 个 元 素 至 少 多 4 个 字 )， 
遍历 (迭代 ) 操作 也 要 慢 得 多 ， 因 为 需要 通过 指针 进行 间接 寻 址 而 不 是 简单 的 连续 访问 。 

forward list 是 单 向 链表 。 你 可 以 将 其 看 作 一 种 为 空 链 表 或 很 短 的 链表 专门 优化 的 数据 
结构 ， 对 这 类 链表 的 操作 通常 是 从 头 开始 遍历 。 为 了 追求 紧凑 存储 ，forward_list 甚至 没有 
提供 size() 操作 ; 一 个 空 forward_list 仅 占用 一 个 内 存 字 。 如 果 你 需要 获取 一 个 forward_ 
list 的 元 素数 目 ， 就 只 能 自己 计数 了 。 如 果 元 素 过 多 ,使 得 计数 代价 过 高 ， 可 能 就 应 该 选择 
其 他 容器 了 。 

除了 下 标 操作 、 容 量 管理 以 及 forward_list 不 提供 size() 外 ，STL 链表 提供 与 vector 
相同 的 成 员 类 型 和 操作 ( 见 31.4 节 )。 此 外 , list 和 forward_list 还 提供 特殊 的 链表 成 员 函 数 : 


list<T> 和 forward_list<T> 的 共同 操作 (iso.23.3.4.5 和 iso.23.3.5.4 ) 


lst.push_front(x) 将 x 添加 到 lst 的 首 元 素 之 前 (使 用 拷贝 或 移动 ) 

lst.pop_front() 删除 lst 的 首 元 素 

lstemplace_front(args) 将 Tfargs} 添加 到 lst 的 首 元 素 之 前 

lst.remove(v) 删除 lst 中 所 有 等 于 v 的 元 素 

Ist.remove _if(f) 删除 lst 中 所 有 满足 f(x)==true 的 元 素 

lst.unique() 删除 lst 中 所 有 的 相 邻 重复 元 素 

lst.unique(f) 删除 lst 中 所 有 的 相 邻 重复 元 素 ， 用 f 进行 相等 判定 

lst.merge(lst2) 合并 有 序 链表 Ilst 和 Ist2， 用 < 确定 序 ; 将 lst2 合并 入 lst， 然 后 将 其 清空 
Ist.merge(lst2,f) 合并 有 序 链表 lst 和 lst2， 用 f 确 定 序 ; 将 lst2 合并 入 lst， 然 后 将 其 清空 
lst.sort() 排序 lst， 用 < 确定 序 

lst.sort(f) 排序 lst， 用 f 确 定 序 


Ist.reverse() 反 转 Ist 中 的 元 素 顺序 ; 不 抛 出 异常 








与 通用 算法 remove() 和 unique() 相反 ( 见 32.5 节 )， 成 员 函 数 版 本 会 影响 链表 的 大 小 。 
例如 : 


void use() 

{ 
list<int> |st {2,3,2,3,5}; 
Ist.remove(3); 1 lst 现在 变 为 {2,2,5} 
lst,unique(); 1 lst 现在 变 为 {2,5} 
cout << lst.size() << \n'; 儿 输出 2 


} 
merge() 算法 是 稳定 的 (stable)， 即 相等 的 元 素 会 保持 相对 顺序 。 





list<T> 的 操作 (iso.23.3.5.5 ) 
p 指向 st 的 一 个 元 素 或 lst.end() 





lst.splice(p,lst2) 将 Ist2 的 元 素 插入 到 p 之 前 ; lst2 变 为 空 
lst.splice(p,lst2,p2) 将 p2 指向 的 lst2 中 的 元 素 插入 p 之 前 ; 该 元 素 从 lst2 中 删除 
lst.splice(p,lst2,b,e) 将 [b: e) 指向 的 lst2 中 的 元 素 插入 p 之 前 ; 这 些 元 素 从 lst2 中 删除 


splice() 操作 不 会 拷贝 元 素 值 ， 也 不 会 令 指 向 元 素 的 迭代 器 失效 。 例 如 : 


list<int> lst1 {1,2,3}; 
list<int> lst2 {5,6,7}; 


auto p = lst1.begin(); 


++p; jp 指向 2 

auto 9q = lst2.begin(); 

++0; /1q 指 向 6 

lst1.splice(p,lst2); Jstl 现在 变 为 {1,5,6,7,2,3}; lst2 现在 变 为 分 


/1p 仍 指 向 2，q 仍 指 向 6 


forward_list 无 法 访问 迭代 器 之 前 的 元 素 (因为 没有 指向 前 驱 元 素 的 链接 )， 因 此 emplace()、 
insert()、erase() 和 splice() 操作 作用 于 迭代 器 之 后 的 位 置 : 


forward_list<T> 的 操作 (iso.23.3.4.6 ) 








p2=lstemplace_after(p,args) 用 args 构造 一 个 元 素 ， 放 置 到 p 之 后 ; p2 指向 新 元 素 

p2=lst.insert_after(p,x) 在 p 之 后 插入 x; p2 指向 新 元 素 

p2=lst.insert_after(p,n,x) 在 p 之 后 插入 x 的 n 个 拷贝 ; p2 指向 新 元 素 

p2=lst.insert_after(p,b,e) 在 p 之 后 插入 [b: e) 间 的 元 素 ; p2 指向 最 后 一 个 新 元 素 

p2=lst.insert_after(p,{felem)) 在 p 之 后 插入 {elem} 中 的 元 素 ; p2 指向 最 后 一 个 新 元 素 ; elem 是 一 个 
initializer_list 

p2=lst.erase_after(p) 删除 p 之 后 的 元 素 ; p2 指向 p 之 后 的 元 素 或 |st.end() 

p2=lst.erase_after(b,e) 删除 [b: e) 间 的 元 素 ; p2=e 

lst.splice_after(p,lst2) 在 lst2 中 p 之 后 的 位 置 进行 切片 

lst.splice_after(p,b,e) 在 [b: e) 间 p 之 后 的 位 置 进行 切片 

lst.splice_after(p,lst2,p2) 在 p2 中 p 之 后 的 位 置 进 行 切片 ， 从 Ist2 中 删除 p2 

lst.splice_after(p,lst2,b,e) 在 [b: e) 间 p 之 后 的 位 置 进行 切片 ; 从 Ist2 中 删除 [b: e) 


这 些 链表 操作 都 是 稳定 的 〈stable)， 即 它们 能 保持 具有 相同 值 的 元 素 的 相对 顺序 。 
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31.4.3 ”关联 容器 


关联 容器 支持 基于 关键 字 的 查找 。 它 有 两 个 变 体 : 
@ 有 序 关 联 容器 (ordered associative container) 基于 一 个 序 标准 (默认 是 小 于 比较 操作 
<) 进行 查找 。 这 类 容器 用 平衡 二 又 树 实现 ， 通 常 是 红 黑 树 。 
@ 无 序 关联 容器 (unordered associative container) 基于 一 个 哈 希 函数 进行 查找 。 这 类 容 
器 用 哈 希 表 实 现 ， 采 用 溢出 链表 策略 。 
两 类 容器 都 支持 : 
。 map: { 键 , 值 } 对 序列 。 
e set: 不 带 值 的 map (或 者 你 可 以 说 关键 字 就 是 值 )。 
最 后 ， 映 射 和 集合， 无 论 是 有 序 的 还 是 无 序 的 ， 都 有 两 个 变 体 : 
e。“ 普 通 ” 映 射 或 集合 : 每 个 关键 字 只 有 唯一 一 项 。 
e“ 多 重 ” 了 映射 或 集合 : 每 个 关键 字 可 对 应 多 项 。 
一 个 关联 容器 的 名 字 指 出 了 它 在 三 维 空间 { 集合 | 映射 , 普通 | 无 序 , 普通 | 多重 } 中 的 
位 置 。 其 中 ,“ 普 通 ”(plain) 不 会 出 现 的 名 字 中 ， 因 此 共有 8 种 关联 容器 : 


关联 容器 (iso.23.4.1 和 iso.23.5.1 ) 
set multiset unordered_set unordered_multiset 


map multimap unordered_map unordered_multimap 


它们 的 模板 参数 将 在 本 节 介 绍 。 

map 和 unordered_map 的 内 在 差别 非常 大 ， 请 参考 31.2.1 节 中 对 它们 内 存 布局 的 图 
示 。 特 别 是 ，map 用 其 比较 指标 (通常 是 <) 比较 关键 字 ， 从 而 在 一 棵 平衡 树 中 搜索 关键 字 
(时 间 复 杂 性 为 O(log(n)))， 而 unordered_map 对 关键 字 应 用 哈 希 函数 ， 从 而 在 一 个 哈 希 表 
中 搜索 关键 字 位 置 (一 个 好 的 哈 希 函数 可 达到 O(1) 时 间 )。 
31.4.3.1 有 序 关联 容器 

下 面 是 map 的 模板 参数 和 成 员 类 型 : 


template<typename Key, 
typename 下 
typename Compare = less<Key>, 
typename Allocator = allocator<pair<const Key, T>>> 
class map { 
public: 
using key_type = Key; 
using mapped_ type =T; 
using value_type = pair<const Key, T>; 
using key_compare = Compare; 
using allocator_type = Allocator; 
using reference = value_type&; 
using const_reference = const value typeé&; 
using iterator = 由 具体 实现 定义 ?ji; 
using const_iterator = /* 由 具体 实现 定义 间 ; 
using size_type =* 由 具体 实现 定义 */; 
using difference_type =/* 由 具体 实现 定义 */; 
using pointer = typename allocator_traits<Allocator>::pointer; 
using const_pointer = typename allocator traits<Allocator>::const_pointer; 
using reverse_iterator = std::reverse_iterator<iterator>; 





using const_reverse_iterator = std::reverse_iterator<const_iterator>; 


class value_compare { /* operator()(k1,k2) 进行 一 次 key_compare()(k1,k2) */; 


1 
}; 


除了 31.3.2 节 中 提 到 的 构造 函数 外 ， 关 联 容器 还 提供 了 人 允许 程序 员 指 定 比 较 器 的 构造 函数 : 


map m {cmp,a)}; 

map m {cmp}; 

map m {}; 

map m {b,e,cmp,a); 
map m {b,e,cmp}; 
map m {b,e}; 

map m {m2}; 

map m {a}; 

map m {m2,a}; 

map m {{elem},cmp,a}; 
map m {{elem},cmp}; 
map m {{elem}}; 


例如 : 


map<K,T,C,A> 构造 函数 (iso.23.4.4.2 ) 
用 比较 器 cmp 和 分 配器 a 构造 m; 显 式 构造 函数 
map m {cmp, Af}; 显 式 构造 函数 
map m {C 人 3; 显 式 构造 函数 
用 比较 器 cmp 和 分 配器 a 构造 m; 用 [b:e) 间 的 元 素 初始 化 容器 元 素 
map m {b,e,cmp, A{}}; 
map m {b,e,C{}}; 
拷贝 和 移动 构造 函数 
构造 默认 map; 使 用 分 配器 a; 显 式 构造 函数 
从 m2 拷贝 或 移动 构造 m; 使 用 分 配器 a 
用 比较 器 cmp 和 分 配器 a 构造 m; 用 initializer_list {felem} 初始 化 容器 元 素 
map m {{elem},cmp,A{}}; 
map m {{elem},C0}; 


map<string,pair<Coordinate,Coordinate>> locations 


{"Copenhagen",{"55:40N","12:34E"}}, 
{"Rome",{"41:54N","12:30E"}}, 
{"New York",{"40:40N","73:56W"} 


小 


关联 容器 提供 多 种 插入 和 查找 操作 : 


v=c[k] 


v=c.at(k) 


p=c.find(k) 
p=c.lower_bound(k) 
p=c.upper_bound(k) 
pair(p1,p2)=c.equal_range(k) 


关联 容器 操作 (iso.23.4.4.1 ) 


v 是 指向 关键 字 为 k 的 元 素 的 引用 ; 若 未 找到 k，, 将 {k,mapped_type{}} 插 
入 ci 仅 适用 于 map 和 unordered_map 


v 是 指向 关键 字 为 k 的 元 素 的 引用 ; 若 未 找到 k， 抛 出 out_of_range ; 仅 
适用 于 map 和 unordered_map 


p 指向 关键 字 为 k 的 第 一 个 元 素 或 c.end() (未 找到 ) 

p 指向 关键 字 >=k 的 第 一 个 元 素 或 c.end() (未 找到 ); 只 适用 于 有 序 容器 
p 指向 关键 字 >k 的 第 一 个 元 素 或 c.end() (未 找到 ); 只 适用 于 有 序 容器 
p1=c.lower_bound(k); p2=c.upper_bound(k) 


x 是 一 个 value_type 或 能 拷贝 和 一 个 value_type 的 某 种 东西 (如 一 个 双 


pair(p,b)=c.insert(x) 


p2=c.insert(p,x) 


c.insert(b,e) 


元 素 的 tuple); 若 x 成 功 插入 容器 ，b 为 true， 若 容器 中 已 有 元 素 与 x 关键 
字 相 同 ，b 为 false; p 指向 关键 字 与 x 相同 的 (可 能 是 新 的 ) 元 素 

x 是 一 个 value_type 或 能 拷贝 人 一 个 value_type 的 某 种 东西 (如 一 个 双 
元 素 的 tuple) ; p 提示 从 哪里 开始 查找 关键 字 与 x 相同 的 元 素 ; p2 指向 关键 
字 与 x 相同 的 (可 能 是 新 的 ) 元 素 


对 [b:e) 间 的 每 个 p 执行 c.insert(*p) 
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( 续 ) 
关联 容器 操作 (iso.23.4.4.1 ) 





c.insert({args}) 


p=c.emplace(args) 


p=c.emplace_hint(h,args) 


r=c.key_comp!() 


r=c.value_comp!() 


n=c.count(k) 





将 initializer_list args 中 的 每 个 元 素 插入 容器 中 ; 元 素 类 型 为 pair<key_ 
type, mapped type> 


从 args 构造 一 个 类 型 为 c 的 value_type 的 对 象 ， 将 它 插 入 c 中 , p 指 向 
该 对 象 


从 args 构造 一 个 类 型 为 c 的 value_type 的 对 象 ， 将 它 插入 c 中 , p 指向 
该 对 象 ; h 为 指向 c 中 的 和 迭代 器 ， 可 能 用 来 提示 从 哪里 开始 搜索 存放 新 元 素 
的 位 置 

r 是 关键 字 比 较 对 象 的 一 个 拷贝 ; 只 适用 于 有 序 容 器 

r 是 值 比较 对 象 的 一 个 拷贝 ; 只 适用 于 有 序 容 器 

n 为 关键 字 等 于 k 的 元 素数 目 


无 序 容器 专 有 操作 将 在 31.4.3.5 节 中 介绍 。 
如 果 下 标 操作 m[k] 未 找到 关键 字 k， 会 将 一 个 默认 值 插 入 容器 。 例 如: 


map<string,string> dictionary; 


dictionary["sea"]="large body of water"; 咱 插 入 元 素 或 向 元 素 赋值 


cout << dictionary["seal"]; 


// 读 取 值 


若 seal 不 在 字典 中 ， 上 面 的 代码 不 会 输出 任何 内 容 : 空 字 符 串 被 作为 seal 的 值 插入 容器 中 ， 


并 作为 查找 操作 的 结果 被 返回 


C 


如 果 这 不 是 所 硕 望 的 行为 ， 我 们 可 以 直接 使 用 find() 和 insert(): 
auto q = dictionary.find("seal"); /| 查找 关键 字 ; 不 会 插入 新 元 素 


if (q==dictionary.end()) { 


cout << "entry not found 


dictionary.insert(make_pair("seal","eats fish")); 


} 
else 
cout q->second; 


实际 上 , [] 并 不 仅仅 是 insert() 的 简写 形式 ， 它 所 做 的 要 更 多 一 些 。m[k] 的 结果 等 价 于 (*(m. 
insert(make_pair(k,V{})).first)).second 的 结果 ， 其 中 V 是 映射 类 型 。 
insert(make_pair()) 这 种 描述 方式 相当 宛 长 ， 我 们 可 以 用 emplace() 取而代之 : 


dictionary.empilace("sea cow", 


"extinct"); 


取决 于 优化 器 的 质量 ， 这 段 代码 可 能 会 更 高 效 。 


如 果 你 试图 将 一 个 值 插入 map， 而 它 的 关键 字 已 存在 于 容器 中 ,那么 map 不 会 有 任何 


改变 。 如 果 你 希望 容器 中 有 多 个 值 具有 相同 的 关键 字 ， 应 使 用 multimap。 


equal_range() 返回 的 pair ( 见 34.2.4.1 节 ) 的 第 一 个 迭代 器 是 lower_bound()， 第 二 个 


迭代 器 是 upper_bound()。 可 以 打印 multimap<string,int> 中 所 有 关键 字 为 “apple” 的 元 素 : 


multimap<string,int> mm {{"apple",2}, { "pear",2}, {"apple",7}, {"orange",2}, {"apple",9})}; 


const string k {"apple"}; 
auto pp = mm.equal_range(k); 
if (pp.first==pp.second) 





cout << "no element with value ™ << k << ""\n",; 
else{ 
cout << "elements with value << k << ":\n"; 
for (auto p=pp.first; p!=pp.second; ++p) 
cout << p->second <<''; 


} 
这 段 代码 会 打印 27 9。 
另 一 种 等 价 写法 是 : 


auto pp = make_pair(m.lower_bound(),m.upper_bound!()); 
hs 


但 是 ， 这 可 能 带 来 对 map 的 一 次 额外 遍历 。equal_range()、lower_bound() 和 upper_ 
bound() 也 提供 了 针对 已 排序 序列 的 版 本 ( 见 32.6 节 )。 

我 倾向 于 将 set 视 为 没有 独立 value_type 的 map。 对 一 个 set 而 言 ，value_type 就 是 
key_type 的 。 考 虑 : 


struct Record { 
string label; 
int value; 


}; 
为 使 用 set<Record>， 我 们 需要 提供 一 个 比较 函数 。 例 如 : 


bool operator<(const Record& a, const Record& b) 


{ 


return a.label<b.label; 


} 
有 了 这 个 函数 ， 我 们 可 以 这 样 编写 代码 : 
set<Record> mr {{"duck",10}, {"pork",12}}; 


void read test() 


for (auto& r : mr) { 
cout << '{" << r.label << ':' << r.value << Y}'; 


} 


cout << endl; 


} 
关联 容器 中 元 素 的 关键 字 是 不 可 变 的 (iso.23.2.4 )。 因 此 ， 我 们 不 能 改变 set 中 的 值 。 我 们 
甚至 不 能 改变 不 参与 比较 的 元 素 的 成 员 。 例 如 : 

void modify_test() 


for (auto&r : mr) 
++r.value; 儿 错误 : 集合 元 素 是 不 可 变 的 


} 
如 果 需 要 修改 元 素 ， 应 使 用 map。 不 要 尝试 修改 关键 字 : 假如 你 成 功 了 ， 就 意味 着 查找 元 
素 的 底层 机 制 会 崩 演 。 


31.4.3.2 ”无 序 关联 容器 

无 序 关联 容器 (unordered_map、unordered_set、unordered_multimap 和 unordered_ 
multiset) 都 是 用 哈 希 表 实现 的 。 对 简单 应 用 而 言 ， 无 序 容器 与 有 序 容器 的 差别 不 大 ， 因 为 关 
联 容器 共享 大 部 分 操作 ( 见 31.4.3.1 节 )。 例 如 : 
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unordered_map<string,int> score1 { 
{"andy", 7}, {"al",9}, {"bill",—3}, {"barbara",12} 
}; 


map<string,int> score2 { 
{"andy”, 7}, {"al",9}, {"bill",~3}, {"barbara",12} 
}; 


template<typename X, typename Y> 
ostream& operator<<(ostream& os, pair<X,Y>& p) 


{ 
return os << '{' << p.first << ',' << p.second << Y}; 
} 
void user() 
{ 
cout <<"unordered: "; 
for (const auto& x : score1) 
cout <<x <<","; 
cout << "\nordered: "; 
for (const auto& x : score2) 
cout <<x <<","; 
} 


可 见 的 差别 是 ，map 的 遍历 是 有 序 的 ， 而 unordered_map 则 不 是 : 


unordered: {andy,7}, {al,9}, {bill,~3}, {barbara,12}, 
ordered: {al,9}, {andy, 7}, {barbara,12}, {bill,~3}, 


unordered_map 的 遍历 顺序 取决 于 插入 顺序 、 哈 希 函 数 和 装载 因子 。 特 别 是 ， 元 素 的 遍历 
顺序 并 不 保证 与 其 插入 顺序 一 致 。 
31.4.3.3 构造 unordered_map 

unordered_map 有 很 多 模板 参数 和 成 员 类 型 别名 : 


template<typename Key, 
typename TT, 
typename Hash = hash<Key>, 
typename Pred = std::equal_to<Key>, 
typename Allocator = std::allocator<std::pair<const Key, T>>> 
class unordered_ map{ 
public: 
using key_type = Key; 
using value_type = std::pair<const Key, T>; 
using mapped_type =T; 
using hasher = Hash; 
using key_equal = Pred; 
using allocator_type = Allocator; 
using pointer = typename allocator_traits<Allocator>::pointer; 
using const_pointer= typename allocator_traits<Allocator>::const_pointer; 
using reference = value_type&i; 
using const_reference = const value_ type& 
using size_type = 人 * 由 具体 实现 定义 */; 
using difference_type =/* 由 其 体 实现 定义 */; 
using iterator = 上 由 具体 实现 定义 */; 
using const_iterator = /* 由 具体 实现 定义 */; 
using local_iterator = /由 具体 实现 定义 9j; 
using const local_iterator = 作 由 具体 实现 定义 */; 

















}; 
默认 情况 下 ，unordered_map<X> 用 hash<X> 计算 哈 希 值 ， 用 equal_to<X> 比较 关键 字 。 
默认 的 equal_to<X> ( 见 33.4 节 ) 简单 地 用 == 比较 X。 
通用 ( 主 ) 模板 hash 并 没有 定义 。 在 需要 时 为 类 型 X 定 义 hash<X> 的 任务 留 给 了 用 
户 。 标 准 库 为 string 这 样 的 常用 类 型 提供 了 hash 的 特例 化 版 本 ,用户 就 不 必 自 己 设计 了 : 


标准 库 提供 了 hash<T> 的 类 型 (iso.20.8.12 ) 


string u16string U32string wstring 

C 风格 字符 串 bool 字符 整数 

浮 点 数 指针 type_index thread::id 
error_code bitset<N> unique_ptr<T,D> shared_ptr<T> 


哈 希 函数 (例如 ，hash 对 类 型 T 的 特例 化 版 本 ， 或 是 一 个 函数 指针 ) 必须 能 用 类 型 为 T 的 
实 参 调 用 ， 并 返回 一 个 size_t ( 见 iso.17.6.3.4 ) 。 对 同一 个 值 两 次 调用 哈 希 函数 必须 得 到 相 
同 的 结果 ， 而 且 理想 情况 是 哈 希 值 应 均匀 分 布 在 size_t 值 域 空间 中 ， 从 而 最 小 化 冲 罕 (“ 冲 
突 ” 意 为 xl=y 但 h(x)==h(y))。 

对 无 序 容 器 来 说 ， 其 模板 参数 、 构 造 函数 以 及 默认 值 组 合 起 来 的 话 会 让 人 混乱 。 但 幸运 
的 是 ， 我 们 有 一 些 固定 模式 : 


unordered_map<K,T,H,E,A> 构造 函数 (iso.23.5.4 ) 


unordered_map m {n,hf,eql,a}: 构造 mn 个 桶 的 m; 哈 希 函数 为 hf， 相 等 比较 函数 为 eql， 分 配器 为 a; 
unordered_map m {n,hf,eql}; unordered_map mt{n,hf,eql,allocator_type{}}; 显 式 构造 函数 
unordered_map m {n,hf}; unordered_map m {n,hf,key_eql{};， 显 式 构造 函数 

unordered_map m {n}; unordered_map m {n,hasher{}}; 显 式 构造 函数 

unordered_map m {}; unordered_map m {N}; 桶 数 N 由 具体 实现 定义 ; 显 式 构造 函数 


此 处 ， 除 了 空 unordered_map 的 情况 ，n 都 表示 元 素 计数 。 


unordered_map<K,TH,E,A> 构造 函数 (iso.23.5.4 ) 


unordered_map m {b,e,n,hf,eql,a}; 构造 n 个 桶 的 m， 初 始 元 素来 自 于 [b:e) 间 的 元 素 ; 使 用 哈 希 函 
数 hf， 相 等 比较 函数 eql 和 分 配器 a 

unordered_map m {b,e,n,hf,eql}; unordered_map m {b,e,n,hf,eql,allocator_type{}}; 

unordered_map m {b,e,n,hf}; unordered_map m {b,e,n,hf,key_equal{}}; 

unordered_map m {b,e,n}; unordered_map m {b,e,n,hasher{}}; 

unordered_map m {b,e}; unordered_map m {b,e,N};; 桶 数 N 由 具体 实现 定义 


此 处 ， 我 们 从 序列 [b:e) 中 获得 初始 元 素 。 元 素数 目 为 [b:e) 中 元 素 的 数目 ， 即 distance(b,e)。 


unordered_map<K,TH,E,A> 构造 函数 (iso.23.5.4 ) 
unordered_map m {{elem},n,hf,eql,a}; 构造 n 个 桶 的 m， 初 始 元 素来 自 于 一 个 initializer_list ; 哈 
希 函 数 为 hf， 相等 比较 函数 为 eql， 分 配器 为 a 


unordered_map m {{elem},n,hf,edql}; unordered_map m {{elem},n,hf,eql,allocator_type{}}; 
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( 续 ) 
unordered_map<K,T,H,E,A> 构造 函数 (iso.23.5.4 ) 
unordered_map m {{elem},n,hf}; unordered_map m {{elem},n,hf,key_equal{}}; 
unordered_map m {{elem},n}; unordered_map m {{elem},n,hasher{}}; 
unordered_map m {{elem}}; unordered_map m {{elem},N};; 桶 数 N 由 具体 实现 定义 


此 处 ， 初 始 元 素来 自 于 一 个 由 分 限定 的 初始 化 器 列表 ，unordered_map 中 元 素数 目 即 为 初 
始 化 列表 中 的 元 素数 目 。 
最 后 ，unordered_map 也 提供 了 拷贝 和 移动 构造 函数 以 及 提供 分 配 右 的 等 价 版 本 : 


unordered_map<K,TH,E,A> 构造 函数 (iso.23.5.4 ) 


unordered_map m {m2}; 拷贝 和 移动 构造 函数 ; 从 m2 构造 m 
unordered_map m {a}; 默认 构造 m， 将 其 分 配器 置 为 a; 显 式 构造 函数 
unordered_map m {m2,a}; 从 m2 构造 m， 将 其 分 配器 置 为 a 


在 使 用 一 个 或 两 个 实 参 构造 unordered_map 时 一 定 要 小 心 。 类 型 组 合 有 很 多 种 可 能 ， 错 误 
组 合 可 能 导致 奇怪 的 错误 信息 。 例 如 : 


map<string,int> m {My_comparator}; /| 正确 
unordered_map<string,int> um {My_hasher}; 儿 错误 


如 果 构 造 函 数 只 有 单一 参数 ， 则 该 参数 必须 是 另 一 个 unordered_map (拷贝 或 移动 构造 函 
数 )、 桶 数目 或 一 个 分 配器 。 我 们 可 以 尝试 这 样 修 改 上 述 错误 语句 : 


unordered_map<string,int> um {100,My_hasher}; // 正 确 


31.4.3.4” 哈 希 和 相等 判定 函数 

用 户 可 以 自 定义 哈 希 函数 ， 定 义 方式 有 多 种 ,不 同 的 技术 可 满足 不 同 的 需求 。 在 本 
节 中 ， 我 会 介绍 几 种 不 同 的 构造 方式 ， 以 最 直接 的 开始 ， 以 最 简单 的 结束 。 考 虑 如 下 简单 
Record 类 型 : 


struct Record { 
string name; 
int val; 
}; 
我 可 以 为 Record 定义 哈 希 和 相等 判定 函数 ， 如 下 所 示 : 
struct Nocase_hash { 
int d = 1; /每 步 和 迭代 将 哈 希 码 左 移 d 位 
size_t operator()(const Record& r) const 


size th=0; 
for (auto x : r.name) { 
h <<= d; 
h “= toupper(x); 
} 


return h; 
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struct Nocase equal{ 
bool operator()(const Record& r,const Record& r2) const 


{ 
if (rname.size()!=r2.name.size()) return false; 
for (int i = 0; i<r.name.size(); ++i) 
if (toupper(r.name[i])!=toupper(r2.name[i])) 
return false; 
return true; 
} 


} 
有 了 这 两 个 函数 ,我们 可 以 定义 并 使 用 Record 的 unordered_set: 


unordered_set<Record,Nocase_ hash,Nocase equal>m{ 
{{"andy”, 7}, {"ai",9}, {"bill",—3}, {"barbara",12} }, 
Nocase_hash{2}, 
Nocase_equal{} 


}; 


for (auto r : m) 
cout <<"{" <<rname <<", <<r.val << "Mn"; 


如 果 和 希望 使 用 上 面 定 义 的 哈 希 和 相等 判定 函数 的 默认 版 本 (这 也 是 最 常见 的 情形 )， 可 以 
在 构造 函数 中 不 提 及 它们 (不 提供 对 应 的 实 参 )，unordered_set 就 会 使 用 它们 的 默认 
版 本 : 


unordered_set<Record,Nocase_hash,Nocase_equal> m{ 
{"andy”, 7}, {"al",9}, {"bill",—3}, {"barbara",12} 
儿 使 用 哈 希 桶 数 4、Nocase_hash{} 和 Nocase equal{} 
}; 
通常 ， 编 写 哈 希 函数 最 简单 的 方式 是 使 用 标准 库 hash 的 特例 化 版 本 ( 见 31.4.3.2 节 )。 例 如 : 


size t hf(const Record& r) { return hash<string>()(r.name) hash<int>()(r.val); }; 


bool eq (const Record& r, const Record& r2) { return rname==r2.name && r.val==r2.val; }; 


用 异 或 运算 (“) 将 哈 希 值 组 合 起 来 会 保持 它们 在 值 域 (类 型 size_t 的 值 的 集合 ) 上 的 分 布 
( 见 3.4.5 节 和 10.3.1 节 )。 
给 定 如 上 哈 希 函数 和 相等 判定 函数 ， 我 们 可 以 定义 一 个 unordered_set: 


unordered_set<Record,decltype(&hf),decltype(&eq)> m { 
{{"andy", 7}, {"al",9}, {"bill",—3}, {"barbara",12} }, 
hf， 
eq 

}; 


for (autor : m) 
cout <<"{" << rname <<",' <<r.val << "}\n"; 


} 
我 们 使 用 了 decltype 来 避免 显 式 重复 hf 和 eq 的 类 型 。 
如 果 我 们 手头 没有 初始 化 器 列表 ， 也 可 指定 初始 大 小 : 
unordered_set<Record,decltype(&hf),decltype(&eq)> m {10,hf,eq}; 
这 也 令 我 们 能 更 容易 地 聚焦 于 哈 希 和 相等 判定 操作 。 
如 果 不 希 望 将 hf 和 eq 的 定义 和 使 用 分 离 ， 可 以 使 用 lambda: 
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unordered_set<Record, 咱 值 类 型 
function<size_t(const Record&)>, 川 哈 希 类 型 
function<bool(const Record&,const Record&)> ”// 相等 判定 类 型 

>m{f10， 


[l(const Record& r) { return hash<string>{}(r.name) hash<int>{}(r.val); }, 
[l(const Record& r, const Record& r2) { return r.name==r2.name && r.val==r2.val; } 
}; 
使 用 (命名 的 或 未 命名 的 ) lambda 代替 函数 的 原因 是 它 可 以 在 函数 内 部 定义 ， 紧 邻 其 使 用 
即 可 。 
但 是 ， 在 本 例 中 ，function 可 能 产生 额外 开销 ， 如 果 程 序 中 频繁 使 用 unordered_set， 
我 还 是 希望 避免 这 种 开销 。 而 且 ， 我 觉得 这 个 版 本 有 些 混 乱 ， 而 更 倾向 于 使 用 命名 lambda: 
auto hf = [](const Record& r) { return hash<string>()(r.name) hash<int>()(r.val); }; 


auto eq = [](const Record& r, const Record& r2) { return rname==r2.name && r.val==r2.val; }; 


unordered_set<Record,decltype(hf),decitype(eq)> m {10,hf,eq}); 


最 后 ,我 们 可 能 更 愿意 通过 特例 化 标准 库 hash 和 equal_to 模板 来 一 次 性 定义 Record 的 所 
有 unordered 容器 的 哈 希 和 相等 判定 函数 ， 其 中 , hash 和 equal_to 由 unordered_map 使 用 : 


namespace std { 
template<> 
struct hash<Record>{ 
size_t operator()(const Record &r) const 


{ 
return hash<string>{}(r.name) hash<int>{}(r.val); 
} 
上 
template<> 


struct equal_to<Record> { 
bool operator()(const Record& r, const Record& r2) const 


return rname==r2.name && r.val==r2.val; 


} 


unordered_ set<Record> m1; 
unordered_ set<Record> m2; 


默认 hash 及 其 生成 的 哈 希 值 (包括 用 异 或 操作 组 合 的 值 ) 通常 已 足够 好 ， 不 要 不 经 任何 实 
验 就 匆忙 用 自己 编写 的 哈 希 函数 替代 它 。 
31.4.3.5 ”装载 因子 和 桶 

无 序 容器 实现 的 重要 部 分 对 程序 员 是 可 见 的 。 我 们 说 具有 相同 哈 希 值 的 关键 字 “ 落 在 
同一 个 桶 中 ”( 见 31.2.1 节 )。 程 序 员 也 可 以 获取 并 设置 哈 希 表 的 大 小 (我 们 所 说 的 “ 哈 希 
桶 数 ”): 


哈 希 策略 (iso.23.2.5 ) 





h=c.hash_function() h 是 c 的 哈 希 函数 
eq=c.key_eq() eq 是 c 的 相等 检测 函数 
d=c.load_factor() d 是 元 素数 除 以 桶 数 : double(c.size())/c.bucket_count(); 不 抛 出 异常 


d=c.max_load_factor() d 是 c 的 最 大 装载 因子 ; 不 抛 出 异常 
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( 续 ) 
哈 希 策略 (iso.23.2.5 ) 
c.max_load_factor(d) 将 c 的 最 大 装载 因子 设置 为 d; 若 c 的 装载 因子 已 经 接近 其 最 大 装载 因子 ，c 将 
改变 蛤 希 表 大 小 (增加 桶 数 ) 
c.rehash(n) 令 c 的 桶 数 >=n 
c.reserve(n) 留 出 能 容纳 n 个 表 项 的 空间 (考虑 装载 因子 ) : c.rehash(ceil(n/c.max_load_ 


factor())) 


无 序 关联 容器 的 装载 因子 (load factor) 定义 为 已 用 空间 的 比例 。 例 如 ， 若 capacity() 为 100 
个 元 素 ，size() 为 30， 则 load_factor() 为 0.3。 

注意 ， 设 置 max_load_ factor、 调 用 rehash() 或 reserve() 的 代价 可 能 非常 高 (最 坏 情 
况 时 间 为 O(n*n))， 因 为 它们 可 能 〈 实 际 场景 中 通常 也 确实 会 ) 重新 哈 希 所 有 元 素 。 这 些 函 
数 用 来 保证 在 程序 执行 过 程 中 重 哈 希 不 会 频繁 发 生 。 例 如 


unordered_set<Record,[](const Record& r) { return hash(r.name); }> people; 
I... 


constexpr int expected = 1000000; /| 期 望 的 元 素数 
people.max_load_ factor(0.7); 咱 哈 希 表 空 间 至 多 使 用 70% 
people.reserve(expected); 儿 大 约 1430000 个 桶 


需要 通过 实验 来 为 给 定 的 一 组 元 素 和 一 个 特定 哈 希 函数 寻找 一 个 合适 的 装载 因子 ， 但 70% 
(0.7) 通常 是 一 个 好 选择 。 


桶 相关 接口 (iso.23.2.5 ) 


n=c.bucket_count() n 是 c 中 的 桶 数 ( 哈 希 表 大 小 ); 不 抛 出 异常 
n=c.max_bucket_count() n 是 一 个 桶 中 的 最 大 元 素数 ; 不 抛 出 异常 
m=c.bucket_size(n) m 为 第 n 个 桶 中 的 元 素数 

i=c.bucket(k) 关键 字 为 k 的 元 素 在 第 i 个 桶 中 

p=c.begin(n) p 指向 桶 n 中 的 首 元 素 

p=c.end(n) p 指向 桶 mn 中 的 尾 元 素 之 后 的 位 置 

p=c.cbegin(n) p 指向 桶 mn 中 的 首 元 素 ; p 为 const 迭代 器 

p =c.cend(n) p 指向 桶 n 中 尾 元 素 之 后 的 位 置 ; p 为 const 迭代 器 


将 满足 c.max_bucket_count()<=n 的 n 作为 桶 下 标 会 导致 未 定义 的 (而 且 很 可 能 是 灾难 性 
的 ) 行为 。 

桶 接口 的 一 个 用 途 是 允许 对 哈 希 函数 进行 实验 : 一 个 糟糕 的 哈 希 函数 会 导致 某 些 关键 字 
值 的 bucket_count() 异常 大 ， 即 ， 很 多 关键 字 被 映射 为 相同 的 哈 希 值 。 


31.5 ”容器 适配器 


容器 适配器 ( container adaptor) 为 容器 提供 不 同 的 (通常 是 受 限 的 ) 的 接口 。 容 器 适 配 
器 的 设计 用 法 就 是 仅 通过 其 特殊 接口 使 用 。 特 别 是 ，STL 容器 适配器 不 提供 直接 访问 其 底层 
容器 的 方式 ， 也 不 提供 迭代 器 或 下 标 操 作 。 

从 一 个 容器 创建 容器 适配器 的 技术 是 一 种 通用 的 按 用 户 需 求 非 侵 入 式 适 配 类 接口 的 
技术 。 
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31.5.1 stack 
容器 适配器 stack 定义 在 <stack> 中 。 它 可 以 描述 为 下 面 的 部 分 实现 : 


template<typename T typename C = deque<T>> 

class stack { li 见 iso.23.6.5.2 

public: 
using value_type = typename C::value_type:; 
using reference = typename C::reference:; 
using const_reference = typename C::const_ reference; 
using size_type = typename C::size_type; 
Using container type = C; 

public: 
explicit stack(const C&); // 从 容器 拷贝 
explicit stack(C&& = C{}); /从 容器 移动 


咱 默认 拷贝 /移动 构造 函数 / 赋值 操作 


template<typename A> 

explicit stack(const A& a); 儿 上 默认 容器 ， 分 配器 为 a 
template<typename A> 

stack(const C& c, const A& a); 儿 从 c 获 得 容器 ， 分 配器 为 a 
template<typename A> 

stack(C&&, const A&); 
template<typename A> 

stack(const stack&, const A&); 
template<typename A> 

stack(stack&&, const A&); 


bool empty() const { return c.empty(); } 

size_type size() const { return c.size(); } 

reference top() { return c.back(); } 

const_reference top() const { return c.back(); } 

void push(const value_type& x){ c.push_back(x); } 

void push(value_type&& x) { c.push_back(std::move(x)); } 
void pop(){c.pop_back(); } 咱 弹 出 最 后 一 个 元 素 


template<typename... Args> 
void emplace(Args&&... args) 


{ 
c.emplace_back(std::forward<Args>(args)...); 

} 

void swap(stack& s) noexcept(noexcept(swap(c, s.c))) 

{ 
using std::swap; /确保 使 用 标准 swap() 
Swap(c,s.c); 

} 

protected: 
Ce; 


}; 
即 ，stack 是 一 个 容器 接口 ， 容 器 类 型 是 作为 模板 实 参 传递 给 它 的 。stack 通过 接口 屏蔽 了 
其 底层 容器 上 的 非 栈 操作 ， 接 口 采用 常规 命名 : top()、push() 和 pop()。 

此 外 ，stack 还 提供 了 常用 的 比较 运算 符 (==、< 等 ) 和 非 成 员 也 数 swap()。 

默认 情况 下 ，stack 用 deque 保存 其 元 素 ,， 但 任何 提供 back()、push_back() 和 pop_ 








back() 操作 的 序列 都 可 使 用 。 例 如 : 


stack<char> s1; 儿 使 用 deque<char> 保存 元 素 
stack<int,vector<int>> s2; /使 用 vector<int> 保存 元 素 


vector 通常 比 deque 更 快 ， 使 用 内 存 也 更 少 。 
stack 对 底层 容器 使 用 push_back() 来 添加 元 素 。 因 此 ， 只 要 机 器 还 有 可 用 内 存 供 容器 
申请 ，stack 就 不 会 “溢出 ”。 另 一 方面 ，stack 可 能 向 下 溢出 : 


void f() 
{ 
stack<int> s; 
s.push(2); 
if (s.empty()) { 儿 向 下 洲 出 可 被 阻止 
/不 弹出 元 素 
} 
else{ /| 但 并 非 不 可 能 
s.pop(); /正常 : s.size() 变 为 0 
s.pop(); // 结果 未 定义 ， 可 能 很 糟糕 
} 


} 


pop() 一 个 元 素 的 目的 不 是 为 了 使 用 它 。 我 们 通常 访问 top() 元 素 ， 然 后 当 不 再 需要 元 素 时 
将 其 pop()。 这 并 没有 太 多 不 便 ， 对 不 必 pop() 的 情况 还 更 高 效 些 ， 而 且 极 大 地 简化 了 异常 
保证 的 实现 。 例 如 : 
void f(stack<char>& s) 
if (s.top()=='c') s.pop(); ”// 删除 初始 的 'c' 
$s 
} 
默认 情况 下 ，stack 使 用 其 底层 容器 的 分 配器 。 如 果 这 不 够 ， 有 几 个 构造 函数 可 以 指定 分 
配 妖 。 


31.5.2 queue 


queue 定义 在 <queue> 中 ， 它 是 一 个 容器 接口 ， 允 许 在 back() 中 插入 元 素 ， 在 front() 
中 提取 元 素 : 
template<typename T, typename C = deque<T> > 
class queue { I 见 iso.23.6.3.1 
1 ..…. 类似 stack .… 
void pop() { c.pop_front(); } /pop 首 元 素 
似乎 所 有 系统 中 都 会 有 队列 的 身影 。 我 们 可 以 为 一 个 简单 的 基于 消息 的 系统 定义 一 个 服务 
器 ， 如 下 所 示 : 


void server(queue<Message>& q, mutex& m) 


while (!q.empty()) { 
Message mess; 
{ ”lock_guard<mutex> ick(m); /提取 消息 时 加 锁 
if (q.empty()) return; /1 其 他 某 人 获得 了 消息 
mess = q.front(); 
q-pop(); 
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儿 处 理 请 求 
} 


31.5.3 priority_queue 


priority_queue 是 一 种 队列 ， 其 中 每 个 元 素 都 被 赋予 一 个 优先 级 ， 用 来 控制 元 素 被 
top() 获取 的 顺序 。priority_queue 的 声明 非常 像 queue， 只 是 多 了 处 理 一 个 比较 对 象 的 代 
码 和 一 组 从 序列 进行 初始 化 的 构造 函数 : 

template<typename T typename C = vector<T>, typename Cmp = less<typename C::value_type>> 

class priority_queue { 儿 见 iso.23.6.4 

protected: 

Ce; 
Cmp comp; 
public: 
priority_queue(const Cmp& x, const C&); 
explicit priority_queue(const Cmp& x = Cmp{}, C&& = C{)); 
template<typename In> 
priority_queue(in b, In e, const Cmp& x, const C& c); /将 [b:e) 间 元 素 插 入 Cc 
/| 

}; 
priority_queue 的 声明 在 <queue> 中 。 

默认 情况 下 ，priority_queue 简单 地 用 < 运算 符 比 较 元 素 ， 用 top() 返回 优先 级 最 高 的 
元 素 : 


struct Message { 
int priority; 
bool operator<(const Message& x) const { return priority < x.priority; } 
/1 

}; 


void server(priority_queue<Message>& q mutex& m) 


while (!q.empty()){ 
Message mess; 
{ ”lock_guard<mutex> ick(m); 几 提 取消 息 时 持 有 锁 
if (q.empty()) return; 儿 其 他 某 人 获得 了 消息 
mess = q.top(); 
q.pop(); 
} 
儿 处 理 优先 级 最 高 的 请 求 
} 
} 


这 段 代码 与 使 用 queue 的 版 本 ( 见 31.5.2 节 ) 的 不 同 之 处 在 于 优先 级 更 高 的 Message 先 获 
得 服务 。 优 先 级 相同 的 元 素 的 处 理 顺 序 未 定义 。 如 果 两 个 元 素 的 优先 级 都 不 高 于 对 方 ， 则 认 
为 它们 优先 级 相同 ( 见 31.2.2.1 节 )。 

保持 元 素 顺序 并 不 是 免费 的 ,但 也 不 一 定 有 很 高 的 代价 。priority_queue 的 一 种 很 有 用 
的 实现 方法 是 使 用 一 个 树 结构 来 追踪 元 素 的 相对 位 置 。 这 种 方法 保证 push() 和 pop() 都 是 
O(log(n)) 时 间 的 。priority_queue 几乎 肯定 是 用 heap 实现 的 ( 见 32.6.4 节 )。 
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31.6 建议 
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一 个 STL 容器 定义 一 个 序列 ; 31.2 节 。 
将 vector 作为 默认 容器 使 用 ; 31.1 节 。 
insert() 和 push_back() 这 样 的 插入 操作 在 vector 上 通常 比 在 list 上 更 高 效 ; 31.2 
节 和 31.4.1.1 节 。 
将 forward_list 用 于 通常 为 空 的 序列 ; 31.2 节 和 31.4.2 节 。 
当 涉 及 性 能 时 ， 不 要 盲目 信任 你 的 直觉 ， 而 要 进行 测试 31.3 节 。 
不 要 盲目 信任 渐进 复杂 性 度量 ; 某 些 序列 很 短 而 单一 操作 的 代价 差异 可 能 很 大 ; 
31.3 节 。 
STL 容器 都 是 资源 句柄 ; 31.2.1 节 。 
map 通常 实现 为 红 黑 树 ; 31.2.1 节 和 31.4.3 节 。 
unordered_map 是 哈 希 表 ; 31.2.1 节 和 31.4.3.2 节 。 
STL 容器 的 元 素 类 型 必须 提供 拷贝 和 移动 操作 ; 31.2.2 节 。 
如 果 你 希望 保持 多 态 行为 ， 使 用 指针 或 智能 指针 的 容器 ; 31.2.2 节 。 
比较 操作 应 该 实现 一 个 严格 弱 序 ; 31.2.2.1 节 。 
以 传 引用 方式 传递 容器 参数 ， 以 传 值 方式 返回 容器 ; 31.3.2 节 。 
对 一 个 容器 ， 用 () 初始 化 器 语法 初始 化 大 小 ， 用 人 初始 化 器 语法 初始 化 元 素 列 
表 ; 31.3.2 节 。 
用 范围 for 循环 或 首尾 迭代 器 对 容器 进行 简单 遍历 ; 31.3.4 节 。 
如 果 不 需要 修改 容器 元 素 ， 使 用 const 迭代 器 ; 31.3.4 节 。 
当 使 用 迭代 器 时 ， 用 auto 避免 元 长 易 错 的 输入 ; 31.3.4 节 。 
用 reserve() 避免 指向 容器 元 素 的 指针 和 迭代 器 失效 ; 31.3.3 节 和 31.4.1 节 。 
未 经 过 测试 不 要 假定 reserve() 会 有 性 能 收益 ; 31.3.3 节 。 
使 用 容器 上 的 push_back() 或 resize()， 而 不 是 数组 上 的 realloc() ; 31.3.3 节 和 
31 术 二季 
vector 和 deque 改变 大 小 后 ， 不 要 继续 使 用 其 上 的 迭代 器 ; 31.3.3 节 。 
在 需要 时 使 用 reserve() 令 性 能 可 预测 ; 31.3.3 节 。 
不 要 假定 [] 会 进行 范围 检查 ; 31.2.2 节 。 
当 需 要 保证 进行 范围 检查 时 使 用 at(); 31.2.2 节 。 
用 emplace() 方 便 符 号 表示 ; 31.3.7 节 。 
优选 紧凑 连续 存储 的 数据 结构 ; 31.4.1.2 节 。 
用 emplace() 避免 提前 初始 化 元 素 ; 31.4.1.3 节 。 
遍历 list 的 代价 相对 较 高 ; 31.4.2 节 。 
list 一 般 会 有 每 元 素 四 个 字 的 额外 内 存 开 销 ; 31.4.2 节 。 
有 序 容器 序列 由 其 比较 对 象 ( 默 认为 <) 定义 ; 31.4.3.1 节 。 
无 序 容器 ( 哈 希 容器 ) 序列 并 无 可 预测 的 序 ; 31.4.3.2 节 。 
如 果 你 需要 在 大 量 数据 中 快速 查找 元 素 ， 使 用 无 序 容器 ; 31.3 节 。 
对 无 自然 序 的 元 素 类 型 (例如 ， 无 合理 的 < 运算 符 )， 使 用 无 序 容 器 ; 31.4.3 节 。 
如 果 需 要 按 顺 序 遍 历 元 素 ， 使 用 有 序 关联 容器 (如 map 和 set); 31.4.3.2 节 。 
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[35 ] 用 实验 检查 你 的 哈 希 函数 是 否 可 接受 ; 31.4.3.4 节 。 

[36 ] 用 异 或 操作 组 合 标准 哈 希 函数 得 到 的 哈 希 函数 通常 有 很 好 的 性 能 ; 31.4.3.4 节 。 
[37] 0.7 通常 是 一 个 合理 的 装载 因子 ; 31.4.3.5 节 。 

[38 ]】 你 可 以 为 容器 提供 其 他 接口 ; 31.5 节 。 

[ 39 ] STL 适配器 不 提供 对 其 底层 容器 的 直接 访问 ; 31.5 节 。 
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STL 算法 
形式 即 解放 。 
一 工程 师 格言 
。 引 言 
。 算 法 


序列 ; 策略 实 参 ; 复杂 性 
e 不 修改 序列 的 算法 
for_each(); 序列 谓词 ; count(); find(); equal() 和 mismatch(); search() 
修改 序列 的 算法 
copy() ; unique() ; remove() 和 replace() ; rotate()、random_shuffle() 和 
partition(); 排列 ; fill(); swap() 
排序 和 搜索 
二 分 搜索 ; merge(); 集合 算法 ; 堆 ; lexcographical_compare(); 
e 最 小 值 和 最 大 值 
e 建议 


32.1 引言 


本 章 介 绍 STL 算法 。STL 包含 标准 库 中 的 迭代 器 、 容 器 、 算 法 和 函数 对 象 几 个 部 分 。 
STL 的 其 他 内 容 将 在 第 31 章 和 第 33 章 介绍 。 


32.2 算法 


<algorithm> 中 定义 了 大 约 80 个 标准 算法 。 它 们 操作 由 一 对 迭代 器 定义 的 (输入 ) 序列 
( sequence) 或 单一 迭代 器 定义 的 (输出 ) 序列 。 当 对 两 个 序列 进行 拷贝 、 比 较 等 操作 时 ， 第 
一 个 序列 由 一 对 和 迭代 器 [b:e) 表示 ， 但 第 二 个 序列 只 由 一 个 迭代 器 b2 表示 ，b2 指出 了 序列 
的 起 始 位 置 。 我 们 要 保证 第 二 个 序列 包含 足够 多 的 元 素 供 算法 使 用 ， 例 如 ， 与 第 一 个 序列 的 
元 素 一 样 多 : [b2:b2+(e-b))。 某 些 算法 ， 例 如 sort()， 要 求 随机 访问 迭代 器 ; 而 很 多 算法 ， 
如 find()， 只 顺序 读 取 元 素 ， 因 此 只 需 前 向 迭代 器 即 可 正常 工作 。 很 多 算法 都 遵循 一 种 常规 
表示 方式 : 返回 序列 的 末尾 来 表示 “未 找到 ”( 见 4.5 节 )。 我 不 再 对 每 个 算法 都 提 及 这 一 点 。 

无 论 是 标准 库 算 法 还 是 用 户 自己 设计 的 算法 ， 都 很 重要 4: 

e 每 个 算法 命名 一 个 特定 操作 ， 描 述 其 接口 ， 并 指定 其 语义 。 

。 每 个 算法 都 可 能 广泛 使 用 并 被 很 多 程序 员 熟 知 。 

与 函数 和 函数 依赖 关系 定义 不 好 的 “随意 代码 ” 相 比 ， 算 法 的 这 两 个 特点 可 能 带 来 正确 
性 、 可 维护 性 以 及 性 能 上 的 巨大 优势 。 如 果 你 发 现 你 写 的 一 段 代 码 有 若干 看 起 来 没什么 关联 
的 循环 、 局 部 变量 ， 或 是 有 很 复杂 的 控制 结构 ， 那 么 就 应 该 考虑 是 否 可 以 简化 代码 ， 将 某 些 
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部 分 改写 为 具有 描述 性 的 名 字 以 及 良好 定义 的 目的 、 接 口 和 依赖 关系 的 函数 / 算法。 
STL 风格 的 数值 算法 将 在 40.6 节 中 介绍 。 


32.2.1 序列 


标准 库 算 法 的 理想 目标 是 为 可 优化 实现 的 某 些 东西 提供 最 通用 最 灵活 的 接口 。 基 于 迭代 
器 的 接口 是 此 理想 目标 的 一 个 很 好 但 不 完美 的 近似 ( 见 33.1.1 节 )。 例 如 ， 基 于 迭代 器 的 接 
口 无 法 直接 表示 序列 的 概念 ， 从 而 导致 在 检测 某 些 范围 错误 时 可 能 会 发 生 混淆 情况 ， 
void user(vector<int>& v1, vector<int>& v2) 
copy(v1.begin(),v1.end(),v2.begin()); /1v2 可 能 溢出 
sort(v1.begin(),v2.end()); /糟糕 ! 
} 


通过 为 标准 库 算法 提供 容器 版 本 ， 很 多 这 类 问题 都 可 以 得 到 缓解 。 例 如 : 
template<typename Cont> 


void sort(Cont& c) 
{ 


static_assert(Range<Cont>()， "sort(): Cont argument not a Range"); 
static_assert(Sortable<lterator<Cont>>(), "sort(): Cont argument not Sortable"); 





std::sort(begin(c),end(c)); 
} 


template<typename Cont1, typename Cont2> 
void copy(const Cont1& source, Cont2& target) 


static_assert(Range<Cont1>(), "copy(): Cont1 argument not a Range"); 
static_assert(Range<Cont2>(), "copy(): Cont2 argument not a Range"); 
if (target.size()<source.size{)) throw out_of_range{"copy target too small"}; 


std::copy(source.begin(),source.end(),target.begin()); 


} 
这 会 简化 user() 的 定义 ,使 第 二 个 错误 不 可 能 出 现 ， 而 第 一 个 错误 会 在 运行 时 被 捕获 : 


void user(vector<int>& v1, vector<int>& v2) 


copy(v1,v2); /溢出 会 被 捕获 
sort(v1); 

} 
但 是 ， 容 器 版 本 的 通用 性 比 直 接 使 用 迭代 器 差 。 特 别 是 ， 不 能 使 用 容器 版 本 的 sort() 排序 半 
个 容器 ， 也 不 能 使 用 容器 版 本 的 copy() 写 一 个 输出 流 。 

一 个 补充 方法 是 定义 一 个 “范围 ”或 “序列 ”抽象 ， 能 允许 我 们 在 需要 时 定义 序列 。 我 
用 概念 Range 表示 具有 begin() 和 end() 迭代 器 ( 见 24.4.4 节 ) 的 任何 东西 。 即 ,不 存在 保 
存 数 据 的 Range 类 就 像 STL 中 不 存在 lterator 类 和 Container 类 一 样 。 因 此 ， 在 “ 容 
器 版 本 sort()” 和 “容器 版 本 copy()” 的 例子 中 ， 我 将 模板 实 参 命名 为 Cont (“容器 ”的 含 
义 )， 但 它们 其 实 会 接受 具有 begin() 和 end() 且 满 足 算法 其 他 要 求 的 任意 序列 。 

大 多 数 标准 库 算 法 返回 迭代 器 。 特 别 是 ， 它 们 不 返回 结果 的 容器 (只 有 极 少数 例外 ， 返 
回 一 个 pair) 。 一 个 原因 是 在 STL 设计 之 初 ， 还 没有 对 移动 语义 的 直接 支持 。 因 此 没有 从 算 
法 高 效 返回 大 量 数据 的 明显 的 方法 。 一 些 程序 员 使 用 显 式 的 间接 寻 址 (如 指针 、 引 用 或 迭代 





第 32 茧 ”STL 蔓 法 61 








器 ) 或 某 些 聪明 的 花招 。 而 如 今 ， 我 们 可 以 做 得 更 好 : 


template<typename Cont, typename Pred> 
vector<Value_type<Cont>*> 
find_all(Cont& c, Pred p) 

{ 


static_assert(Range<Cont>(), "find_all(): Cont argument not a Range"); 
static_assert(Predicate<Pred>(), "find_all(): Pred argument not a Predicate"); 


vector<Value_ type<Cont>*> res; 
for (auto& x : c) 

if (p(x)) res.push_back(&x); 
return res; 


} 
在 C++98 中 ， 在 匹配 结果 很 多 的 情况 下 ， 此 find_all() 的 性 能 很 可 能 很 差 。 如 果 选 择 标准 
库 算法 会 受 局 限 或 是 性 能 很 差 . 采用 STL 算法 的 新 版 本 或 全 新 算法 是 一 种 可 行 的 改进 方式 ， 
比 编写 “随意 代码 ”解决 问题 要 好 得 多 。 

注意 ,无论 一 个 STL 算法 返回 什么 ， 它 都 不 会 是 实 参 的 容器 。 传 递 给 STL 算法 的 实 参 
是 迭代 器 ( 见 第 33 章 )， 算 法 完全 不 了 解 和 闪 代 器 所 指向 的 数据 结构 。 和 迭代 器 的 存在 主要 是 为 
了 将 算法 从 它 所 处 理 的 数据 结构 上 分 离开 来 ， 反 之 亦 然 。 


32.3 策略 实 参 


大 多 数 标准 库 算 法 都 有 两 个 版 本 : 

e 一 个 “普通 ”版 本 使 用 常规 操作 (如 < 和 ==) 完成 其 任务 
®。 另 一 个 版 本 接受 关键 操作 参数 

例如 : 


template<class lter> 
void sort(lter first, lter last) 


{ 
咱 ... 用 el<e2 进行 排序 ... 
} 


template<class lten class Pred> 
void sort(lter first, iter last, Pred pred) 


咱 ... 用 pred(el,e2) 进行 排序 … 
} 


这 极 大 地 提高 了 标准 库 的 灵活 性 和 应 用 范围 。 
一 个 算法 的 两 个 常用 版 本 可 以 实现 为 两 个 ( 重 载 的) 函数 模板 或 是 带 默 认 实 参 的 单一 函 
数 模板 。 例 如 : 


template<typename Ran, typename Pred = less<Value_type<Ran>>> /| 使 用 一 个 默认 模板 实 参 
sort(Ran first, Ran last, Pred pred ={}) 


儿 .. 使 用 pred(x,y).… 
} 
如 果 使 用 函数 指针 ， 就 能 察觉 两 个 函数 和 带 默 认 实 参 的 单一 函数 间 的 差异 。 不 过 ， 还 是 将 标 
准 库 算法 的 很 多 版 本 简单 看 作 “ 带 默认 谓词 的 版 本 ”比较 好 ， 这 能 将 你 需要 记忆 的 函数 模板 
的 数量 减少 差不多 一 半 。 
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在 某 些 情况 下 ， 实 参 既 可 以 解释 为 谓词 ， 也 可 以 解释 为 值 。 例 如 : 

bool pred(int); 

auto p= find(b,e,pred);”// 查找 元 素 pred 还 是 应 用 谓词 pred() ? (后 者 ) 
一 般 而 言 ， 编 译 器 无 法 消除 这 类 代码 的 二 义 性 ， 而 且 即 使 是 编译 器 能 消除 二 义 性 的 情况 ， 程 
序 员 也 会 感到 困惑 。 

为 了 简化 程序 员 的 任务 ， 标 准 库 一 般 使 用 后 缀 if 指出 算法 接受 一 个 谓词 。 使 用 两 个 名 
字 来 区 分 不 同 版 本 是 为 了 减少 二 义 性 和 困扰 。 考 虑 下 面 的 例子 : 

using Predicate = bool(*)(int); 


void f(vector<Predicate>& v1, vector<int>& v2) 


auto p1 = find(v1.begin(),v1.end(),pred); 儿 查找 值 为 pred 的 元 素 
auto p2 = find_if(v2.begin(),v2.end(),pred); /|/ 统计 令 pred() 为 true 的 元 素数 


某 些 作为 实 参 传递 给 算法 的 操作 会 修改 所 施用 的 元 素 (例如 ， 传 递 给 for_each() 的 一 些 操 
作 ; 见 32.4.1 节 )， 但 大 多 数 操作 还 是 谓词 〈 例 如 传递 给 sort() 的 比较 对 象 )。 除 非特 别 说 明 ， 
我 们 假定 传递 给 算法 的 策略 实 参 不 会 修改 元 素 。 特 别 是 ， 不 要 试图 用 谓词 修改 元 素 : 

int n_even(vector<int>& v) 咱 不 要 这 么 做 


/统计 v 中 偶数 值 的 数目 
{ 


} 
通过 谓词 修改 元 素 会 模糊 代码 的 实际 目的 。 如 果 你 真 的 意图 不 轨 ， 甚 至 可 以 修改 序列 〈 例 
如 ， 对 一 个 正在 被 遍历 的 容器 ， 用 其 名 字 向 其 插入 或 从 其 删除 元 素 )， 从 而 令 遍 历 失 败 (可 
能 是 以 某 种 隐 莓 的 方式 失败 )。 为 了 避免 这 种 事故 ， 你 可 以 传递 给 谓词 const 引用 参数 。 

类 似 地 ， 谓 词 不 能 携带 能 改变 其 操作 含义 的 状态 。 一 个 算法 实现 可 能 会 拷贝 谓词 ， 而 
我 们 几乎 不 可 能 希望 谓词 多 次 作用 于 相同 的 值 却 得 到 不 同 的 结果 。 传 递 给 算法 的 一 些 函 数 对 
象 ， 例 如 随机 数 发 生 器 ， 确 实 携带 可 变 的 状态 。 除 非 你 真 的 确定 算法 不 会 拷贝 谓词 ， 否 则 就 
应 将 函数 对 象 实 参 的 可 变 状态 保存 在 另 一 个 对 象 中 ， 并 且 通 过 指针 或 引用 访问 它 。 

指针 元 素 上 的 == 和 < 操作 极 少 适 合 STL 算法 的 需求 : 它们 比较 的 是 机 器 地 址 而 非 所 指 
向 的 值 。 特 别 是 ， 不 要 用 默认 的 == 和 < 排序 或 搜索 C 风格 字符 串 容 器 ( 见 32.6 节 )。 


32.3.1 复杂 性 


与 容器 类 似 ( 见 31.3 节 ), 算法 的 复杂 性 也 是 由 标准 定义 的 。 大 多 数 算法 是 线性 时 间 
O(n) 的 , n 通常 是 输入 序列 的 长 度 。 


return find_if(v.begin(),v.end(),[](int& x) {++x; return x&1; }); 





算法 复杂 性 (iso.25 ) 


O(1) Swap()，iter_ swap() 

O(log(n)) lower_bound(), upper_bound(), equal_range(), binary_search(), push_heap!(), 
push_heap() 

O(n*log(n)) inplace_merge() (最 坏 情况 )，stable_partition() (最 坏 情 况 )，sort()，stable_sort()， 
partial_sort(), partial_sort_copy(), sort_heap!() 

O(n*n) find_end(), find_first_of(), search(), search_n() 


O(n) 其 他 所 有 算法 
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照例 ， 上 表 列 出 的 都 是 渐进 复杂 性 ， 而 且 你 必须 了 解 n 衡量 的 是 什么 ， 才 能 明白 这 些 复杂 
性 意味 着 什么 。 例 如 ， 若 n<3, 平方 算法 可 能 是 最 好 的 选择 。 每 步 迭 代 的 代价 也 可 能 千 差 万 
别 。 例 如 ， 虽然 复杂 性 都 是 线性 ( O(n)), 但 遍历 链表 比 遍历 向 量 慢 得 多 。 复 杂 性 评价 并 非 
是 为 了 取代 常识 和 性 能 测试 ; 它 不 过 是 保证 代码 质量 的 众多 工具 之 一 。 


32.4 不 修改 序列 的 算法 

不 修改 序列 的 算法 只 读 取 输入 序列 中 元 素 的 值 ， 而 不 会 重 排序 列 或 是 改变 元 素 值 。 用 户 
提供 给 算法 的 操作 一 般 也 不 会 改变 元 素 值 ， 这 些 操作 通常 是 谓词 (不 会 修改 实 参 )。 
32.4.1 for_each!() 

最 简单 的 算法 是 for_each()， 它 简单 地 对 序列 中 的 每 个 元 素 执 行 指定 操作 : 


for_each() (iso.25.2.4 ) 
f=for_each(b,e,f) 对 [b:e) 中 的 每 个 x 执行 fx); 返回 f 


只 要 可 能 ， 应 该 优选 更 专用 的 算法 。 
传递 给 for_each() 的 操作 可 能 会 修改 元 素 。 例 如 : 


void increment_all(vector<int>& v) /递增 v 中 每 个 元 素 
{ 
for_ each(vbegin(),vend(), [(int& x) {++x;}); 
} 
32.4.2 序列 谓词 


序列 谓词 (iso.25.2.1 ) 


all_of(b,e ,f) [b:e) 中 所 有 x 都 满足 f(x) 吗 ? 

any_of(b,e ,f) [b:e) 中 某 个 x 满足 f(x) 吗 ? 

none_of(b,e ,f) [b:e) 中 所 有 x 都 不 满足 f(x) 吗 ? 
例如 : 


vector<double> scale(const vector<double>& val, const vector<double>& div) 


{ 
assert(val.size()<div.size()); 
assert(all_of(div.begin(),div.end(),[](double x){ return 0<x; }); 


vector res(val.size()); 

for (int i = 0; i<val.size(); ++i) 
resfil = valfil/div[i]; 

return res; 


} 
当 一 个 序列 谓词 失败 时 ， 它 不 会 告知 我 们 是 哪个 元 素 导 致 了 失败 。 
32.4.3 count() 


count() (iso.25.2.9 ) 
x=count(b,e ,v) x 为 [b:e) 中 满足 v==*p 的 元 素 *p 的 数目 
x=count_if(b,e ,f) x 为 [b:e) 中 满足 f(*p) 的 元 素 *p 的 数目 
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例如 : 
void f(const string& s) 
{ 
auto n_space = count(s.begin(),s.end()," "); 
auto n_whitespace = count_if(s.begin(),s.end(),isspace); 
gf 
} 


谓词 isspace() ( 见 36.2 节 ) 统计 所 有 空白 字符 ， 而 不 仅仅 是 空格 。 
32.4.4 find() 
find() 系列 算法 顺序 搜索 具有 特定 值 或 令 谓词 为 真 的 元 素 : 


find 序列 算法 (iso.25.2.5 ) 


p=find(b,e,v) p 指向 [b:e) 中 第 一 个 满足 *p==v 的 元 素 
p=find_if(b,e,f) p 指向 [b:e) 中 第 一 个 满足 f(*p) 的 元 素 
p=find_if_not(b,e,f) p 指向 [b:e) 中 第 一 个 满足 !f(*p) 的 元 素 


p=find_first_of(b,e,b2,e2) p 指向 [b:e) 中 第 一 个 满足 *p==*q 的 元 素 ， 其 中 q 指向 [b2:e2) 中 的 某 个 元 素 
p=find_first_of(b,e,b2,e2,f) p 指向 [b:e) 中 第 一 个 满足 f(*p,*q) 的 元 素 ， 其 中 q 指向 [b2:e2) 中 的 某 个 元 素 


p=adjacent_find(b,e) p 指向 [b:e) 中 第 一 个 满足 *p==*(p+1) 的 元 素 
p=adjacent_find(b,e,f) p 指向 [b:e) 中 第 一 个 满足 f(*p,*(p+1)) 的 元 素 
p=find_end(b,e,b2,e2) p 指向 [b:e) 中 最 后 一 个 满足 *p==*q 的 元 素 ， 其 中 q 指向 [b2:e2) 中 的 某 个 元 素 


p=find_end( b,e,b2,e2,f) p 指向 [b:e) 中 最 后 一 个 满足 f(*p,*q) 的 元 素 ， 其 中 q 指向 [b2:e2) 中 的 某 个 元 素 


算法 find() 和 find_if() 都 返回 一 个 迭代 器 ， 分 别 指向 匹配 给 定 值 和 给 定 谓词 的 第 一 个 元 素 。 
void f(const string& s) 


{ 
auto p_space = find(s.begin(),s.end(),' "); 
auto p_whitespace = find_if(s.begin(),s.end(), isspace); 
Wa 

} 


算法 find_first_of() 查找 序列 中 与 另 一 个 序列 中 元 素 相 等 的 第 一 个 元 素 。 例 如 : 


array<int> x = {1,3,4 }; 
array<int> y = {0,2,3,4,5}; 


void f() 
{ 
auto p =find first_of(x.begin(),x.end(),y.begin(),y.end); Jp=&x[]] 
auto q=find first_of(p+1,x.end(),y.begin(),y.end()); llq= &x[2] 
} 


迁 代 器 p 将 指向 x[1， 因 为 3 是 x 中 第 一 个 与 y 中 元 素 相等 的 元 素 。 类 似 地 ，q 将 指向 x[2]。 
32.4.5 equal() 和 mismatch() 
算法 equal() 和 mismatch() 比较 一 对 序列 : 


equal() 和 mismatch() (iso.25.2.11，iso.25.2.10 ) 
equal(b,e,b2) [b:e) 和 [b2:b2+(e-b)) 中 所 有 对 应 元 素 都 满足 v==v2 ? 





( 续 ) 
equal() 和 mismatch() (iso.25.2.11，iso.25.2.10 ) 
equal(b,e,b2,f) [b:e) 和 [b2:b2+(e-b)) 中 所 有 对 应 元 素 都 满足 f(v,v2) ? 
pair(p1,p2)=mismatch(b,e,b2) p1 指向 [b:e) 中 第 一 个 满足 !(*p1==*p2) 的 元 素 , p2 指向 [b2:b2+(e-b)) 
中 的 对 应 元 素 ; 若 不 存在 这 样 的 元 素 ， 则 p1==e 
pair(p1,p2)=mismatch(b,e,b2,) p1 指向 [b:e) 中 第 一 个 满足 !f(*p1,*p2) 的 元 素 ，p2 指向 [b2:b2+(e-b)) 


中 的 对 应 元 素 ; 若 不 存在 这 样 的 元 素 ， 则 p1==e 


mismatch() 查找 两 个 序列 中 第 一 对 不 匹配 的 元 素 ， 返 回 指向 这 两 个 元 素 的 迭代 器 。 并 没有 
参数 指出 第 二 个 序列 的 末尾 ; 即 ， 不 存在 last2。 取 而 代 之 的 是 ， 算 法 假定 第 二 个 序列 中 至 
少 包 含 与 第 一 个 序列 一 样 多 的 元 素 ， 并 将 first2+(last-first) 作为 last2。 这 种 技术 在 标准 库 中 
被 大 量 使 用 ， 凡 是 用 两 个 序列 提供 成 对 处 理 的 元 素 的 场景 都 会 用 到 这 种 技术 。 我 们 可 以 这 样 
实现 mismatch(): 


template<class In, class In2, class Pred = equal_to<Value type<In>>> 
pair<in, In2> mismatch(In first, In last, In2 first2, Pred p ={}) 


{ 
while (first != last && p(*first,*first2)) { 
++first; 
++first2; 
return {first,first2}; 
} 


这 里 使 用 了 标准 函数 对 象 equal_to ( 见 33.4 节 ) 和 类 型 函数 Value_type ( 见 28.2.1 节 )。 


32.4.6 search() 
算法 search() 和 search_n() 查找 给 定 序列 是 否 是 另 一 个 序列 的 子 序列 : 


搜索 序列 (iso.25.2.13 ) 


p=search(b,e,b2,e2) p 指向 [b:e) 中 第 一 个 满足 [p:p+(e2-b2)) 等 于 [b2:e2) 的 *p 
p=search(b.e,b2,e2,f) p 指向 [b:e) 中 第 一 个 满足 [p:p+(e2-b2)) 等 于 [b2:e2) 的 *p， 用 ff 比较 元 素 
p=search_n(b,e,n,v) p 指向 [b:e) 中 第 一 个 满足 [p:p+n) 间 所 有 元 素 的 值 均 为 v 的 位 置 
p=search_n(b,e,n,v,f) p 指向 [b:e) 中 第 一 个 满足 [p:p+n) 间 每 个 元 素 *q 均 满 足 f(*p,v) 的 位 置 


算法 search() 将 第 二 个 序列 看 作 子 序列 ， 在 第 一 个 序列 中 查找 它 。 如 果 找 到 ， 则 返回 一 个 迭代 
器 ， 指 向 第 一 个 序列 中 匹配 子 序列 的 第 一 个 元 素 。 照 例 ， 序 列 尾 用 来 表示 “未 找到 ”。 例 如 : 


string quote {"Why waste time learning, when ignorance is instantaneous?"); 


bool in_quote(const string& s) 


{ 
auto p = search(quote.begin(),quote.end(),s.begin(),s.end()); // 在 quote 中 查找 s 
return pl=quote.end!(); 

} 

void g() 


bool b1 = in_quote("learning"); lbl= true 
bool b2 = in_quote("lemming"); ll b2 = false 


66 笋 四 部 分 丰 准 庆 





因此 ， 对 查找 子 字符 串 而 言 ，search() 是 一 个 很 有 用 的 算法 ， 而 且 已 经 推广 到 所 有 序列 中 。 
如 果 只 是 查找 单一 元 素 ， 应 使 用 find() 或 binary_search() ( 见 32.6 节 )。 


32.5 ”修改 序列 的 算法 


修改 序列 的 算法 〈 也 称 为 可 变 序 列 算法 ，mnutating sequence algorithm) 可 以 (通常 也 确 
实 会 ) 修改 其 实 参 序列 的 元 素 。 


transform (iso.25.3.4 ) 


”p=transform(b,e,outf) ”对 [bie) 中 的 每 个 元 素 *p1 应 用 *q=f(*p1)， 结 果 写 入 [out:out+(e-b)) 中 的 
对 应 元 素 *q; p=out+(e-b) 
p=transform(b,e,b2,out,f) 对 [b:e) 中 的 每 个 元 素 *p1 及 其 在 [b2:b2+(e-b)) 中 的 对 应 元 素 *p2 应 用 


*q=f(*p1,*p2)， 结 果 写 入 [out:out+(e-b)) 中 的 对 应 元 素 *q; p=out+(e-b) 


令 人 有 些 困惑 的 是 ，transform() 不 一 定 改 变 其 输入 序列 ， 而 是 基于 一 个 用 户 提供 的 操作 对 
输入 进行 变换 生成 一 个 输出 序列 。 单 输入 序列 版 本 的 transform() 可 定义 如 下 : 
template<class In, class Out, class Op> 


Out transform(in first, In last, Out res, Op op) 


while (firsti=iast) 
*rest+ = op(*first++); 
return res; 


} 


输出 和 输入 可 能 是 同一 个 序列 : 
void toupper(string& s) // 转换 为 大 写 


{ 
transform(s.begin(),s.end(),s.begin(),toupper); 
} 
这 个 函数 真正 转换 输入 序列 s。 


32.5.1 copy() 


copy() 系列 算法 从 一 个 序列 拷贝 元 素 至 另 一 个 序列 。 接 下 来 的 几 节 将 介绍 copy() 与 其 
他 算法 组 合 的 不 同 版 本 ,例如 replace_copy() ( 见 32.5.3 节 )。 


copy 系列 算法 (iso.25.3.1 ) 





p=copy(b,e,out) 将 [b:e) 中 的 所 有 元 素 拷贝 至 [out:p); p=out+(e-b) 
p=copy_if(b,e,out,f) 将 [b:e) 中 满足 f(x) 的 元 素 x 拷贝 至 [out:p) 

p=copy_n(b,n,out) 将 [b:b+n) 间 的 前 n 个 元 素 拷贝 至 [out:p); p=out+n 
p=copy_backward(b,e,out) 将 [b:e) 中 的 所 有 元 素 拷贝 至 [out:p)， 从 尾 元 素 开 始 拷贝 ; p=out+(e-b) 
p=move(b,e,out) 将 [b:e) 中 的 所 有 元 素 移动 至 [out:p); p=out+(e-b) 
p=move_backward(b,e,out) 将 [b:e) 中 的 所 有 元 素 移动 至 [out:p)， 从 尾 元 素 开始 移动 ; p=out+(e-b) 


拷贝 算法 的 目标 序列 不 一 定 是 一 个 容器 ， 任 何 可 用 一 个 输出 迭代 器 ( 见 38.5 节 ) 描述 的 东西 
都 可 以 作为 它 的 目标 。 例 如 : 
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void f(list<Club>& Ic, ostream& os) 


{ 


copy(lc.begin(),lc.end(),ostream_iterator<Club>(os)); 


} 


为 了 读 取 一 个 序列 ， 我 们 需要 一 对 和 迭代 器 描述 起 始 位 置 和 结尾 位 置 。 为 了 向 序列 中 写 人 数 
据 ， 我 们 只 需 一 个 迭代 器 (描述 向 哪里 写 和 信 )。 但 是 ,我 们 必须 小 心 ， 数 据 写 人 操作 不 能 超 
出 目标 序列 末尾 。 有 一 种 方法 可 以 确保 不 出 现 这 种 情况 : 使 用 一 个 插入 器 ( 见 33.2.2 节 ) 按 
需 增长 目标 序列 。 例 如 : 


void f(const vector<char>& vs, vector<char>& v) 
{ 
copy(vs.begin(),vs.end(),v.begin()); 儿 可 能 超出 v 的 末尾 
copy(vs.begin(),vs.end(),back_inserter(v)); ”// 将 vs 中 的 元 素 追 加 到 v 的 末尾 
} 
输入 序列 和 输出 序列 可 能 重 玲 。 只 有 当 两 个 序列 不 重 释 或 输出 序列 的 末尾 位 于 输入 序列 内 部 
时 ， 我 们 才 可 以 使 用 copy()。 
我 们 用 copy_if() 拷贝 满足 某 种 标准 的 元 素 。 例 如 : 


void fllist<int>&ld, int n, ostream& os) 


{ 
copy_if(ld.begin(),ld.end()， 
ostream_iterator<int>(os)， 
[I(int x) { return x>n); ); 
} 


另 请 参阅 remove_copy _if()。 


32.5.2 unique() 
算法 unique() 从 序列 中 删除 连续 的 重复 元 素 : 


unique 系列 (iso.25.3.9 ) 


p=unique(b,e) 移动 [b:e) 中 的 一 些 元 素 ， 使 得 [b:p) 中 无 连续 重复 元 素 

p=unique(b,e,f) 移动 [b:e) 中 的 一 些 元 素 ， 使 得 [b:p) 中 无 连续 重复 元 素 ;“ 重 复 ” 由 
f(*p,*(p+1)) 判定 

p=unique_copy(b,e,out) 将 [b:e) 中 的 元 素 拷贝 至 [out:p); 不 拷贝 连续 重复 元 素 

p=unique_copy(b,e,out,f) 将 [b:e) 中 的 元 素 拷贝 至 [out:p) ; 不 拷贝 连续 重复 元 素 ;“ 重 复 ” 由 
f(*p,*(p+1)) 判定 


算法 unique() 和 unique_copy() 删除 连续 的 重复 值 。 例 如 
void fllist<string>& ls, vector<string>& vs) 
ls.sort(); 1/ 链表 排序 ( 见 31.4.2 节 ) 


unique_copy(ls.begin(),ls.end(),back_inserter(vs)); 


} 


这 有 段 代码 将 ls 的 元 素 拷贝 到 vs 中 ， 过 程 中 会 删除 连续 重复 元 素 。 我 用 sort() 将 相等 的 字符 
串 排列 到 相 邻 位 置 。 
类 似 其 他 标准 库 算 法 ，unique() 对 迭代 器 进行 操作 。 它 并 不 了 解 和 迭代 融 指 向 哪个 容器 ， 
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因此 它 不 能 修改 容器 ， 只 能 修改 元 素 的 值 。 这 意味 着 unique() 不 能 如 我 们 所 期 望 的 那样 从 
输入 序列 中 删除 重复 元 素 。 例 如 ， 下 面 的 代码 无 法 删除 一 个 vector 中 的 重复 元 素 : 


void bad(vector<string>& vs) 儿 警告 : 它 并 不 能 像 看 起 来 那样 完成 期 望 目标 
{ 

sort(vs.begin(),vs.end()); 川 排序 vector 

unique(vs.begin(),vs.end()); ”// 删除 重复 元 素 ( 它 做 不 到 ! ) 
} 


相反 ，unique() 将 不 重复 的 元 素 移动 到 序列 前 部 ( 头 部 )， 并 返回 指向 不 重复 元 素 末尾 位 置 
的 迭代 器 。 例 如 : 


int main() 


{ 





string s ="abbcccde"; 


auto p = unique(s.begin(),s.end()); 
cout <<s << ”<< p-s.begin() << "\n’; 


} 
此 程序 将 输出 

abcdecde 5 
即 ，p 指向 第 二 个 c( 即 第 一 个 重复 字符 )。 

本 可 以 删除 元 素 (但 实际 不 能 ) 的 算法 通常 有 两 种 形式 :“ 普 通 ” 版 本 重 排 元 素 顺 序 ， 
类 似 unique(); _copy 版 本 生成 一 个 新 的 序列 ， 类 似 unique_copy()。 

为 了 从 一 个 容器 中 删除 重复 元 素 ， 我 们 必须 显 式 地 收缩 容器 : 


template<class C> 
void eliminate_duplicates(C& c) 


sort(c.begin(),c.end()); 儿 排 序 
auto p = unique(c.begin(),c.end()); // 紧凑 存储 
c.erase(p,c.end()); 外 收缩 


} 


可 以 将 这 段 代 码 写 成 等 价 的 形式 c.erase(unique(c.begin(),c.end()),c.end())， 但 我 不 认为 这 
种 精炼 会 提高 可 读 性 或 可 维护 性 。 


32.5.3 remove() 和 replace() 
算法 remove()“ 删 除 ”序列 末尾 的 元 素 : 


remove (iso.25.3.8 ) 


p=remove(b,e,v) 从 [b:e) 中 删除 值 为 v 的 元 素 ， 使 得 [b:p) 中 的 元 素 都 满足 !(*q==v) 
p=remove _if(b,e,f) 从 [b:e) 中 删除 元 素 *g， 使 得 [b:p) 中 的 元 素 都 满足 !f(*q) 
p=remove_copy(b,e,out,v) 将 [b:e) 中 满足 !(*q==v) 的 元 素 拷贝 至 [out:p) 

p=remove_copy _if(b,e,out,f) 将 [b:e) 中 满足 !f(*q) 的 元 素 拷贝 至 [out:p) 

reverse(b,e) 将 [b:e) 中 的 元 素 逆 序 排列 

p=reverse_copy(b,e ,out) 将 [b:e) 中 的 元 素 逆 序 拷贝 至 [out:p) 


replace() 算法 将 新 值 赋予 选 定 的 元 素 : 
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replace (iso.25.3.5 ) 


replace(b,e,v,v2) 将 [bie) 中 满足 *p==v 的 元 素 替 换 为 v2 
replace_if(b,e,f,v2) 将 [b:e) 中 满足 f(*p) 的 元 素 替换 为 v2 
p=replace_copy(b,e,out,v,v2) 将 [b:e) 中 的 元 素 拷贝 至 [out:p)， 其 中 满足 *p==v 的 元 素 被 替换 为 v2 


p=replace_copy_if(b,e,out,f,v2) 将 [b:e) 中 的 元 素 拷贝 至 [out:p)， 其 中 满足 f(*p,v) 的 元 素 被 替换 为 v2 


这 些 算法 不 能 改变 输入 序列 的 大 小 ， 因 此 即使 是 remove() 也 会 保持 输入 序列 大 小 不 变 。 类 
似 unique()， 它 是 通过 将 元 素 移动 到 左 侧 来 实现 “删除 ”的 。 例 如 : 


string s {"*CamelCase*lsUgly:"); 


cout << s << "\n'; 儿 输出 *CamelCase*IsUgly* 
auto p = removel(s.begin(),s.end(),"*"); 
copy(s.begin(),p,ostream_iterator<char>{cout}); 儿 输出 CamelCaselsUgly 
cout << s << "\n'; 儿 输出 CamelCaselsUglyly* 


32.5.4 rotate()、random_shuffle() 和 partition() 
算法 rotate()、random_shuffle() 和 partition() 提供 了 移动 序列 中 元 素 的 系统 方法 : 


rotate() (iso.25.3.11 ) 





p=rotate(b,m,e) 循环 左 移 元 素 : 将 [b:e) 看 作 一 个 环 首 元 素 在 尾 元 素 之 后 ; 将 
*(b+i) 移动 到 *(b+(i+(e-m))%(e-b)); 注意 ，*b 移动 到 *m; p=b+(e-m) 
p=rotate_copy(b,m,e,out) 将 [b:e) 中 的 元 素 循环 左 移 拷贝 至 [out:p) 


rotate()( 以 及 洗 牌 和 划分 算法 ) 是 用 swap0 来 移动 元 素 的 : 


random_shuffle() (iso.25.3.12 ) 


random_shuffle(b,e) 洗 牌 [b:e) 中 的 元 素 ， 使 用 默认 随机 数 发 生 器 
random_shuffle(b,e,f) 洗 牌 [b:e) 中 的 元 素 ， 使 用 随机 数 发 生 器 f 
shuffle(b,e,f) 洗 牌 [b:e) 中 的 元 素 ， 使 用 均匀 分 布 随机 数 发 生 器 f 


洗 牌 算法 重 排序 列 的 方式 非常 像 我 们 洗 扑 克 牌 。 即 ， 在 一 次 洗 牌 之 后 ， 元 素 的 顺序 是 随机 
的 ， 这 里 的 “随机 ”是 由 随机 数 发 生 器 生成 的 分 布 所 决定 的 。 

默认 情况 下 ，random_shuffle() 用 均匀 分 布 随机 数 发 生 器 洗 牌 序列 。 即 ， 它 选择 序列 元 
素 的 一 个 排列 ， 使 得 每 种 排列 被 选中 的 概率 相等 。 如 果 你 想 要 一 个 不 同 的 分 布 或 一 个 更 好 的 
随机 数 发 生 器 ， 可 以 自己 定义 。 若 调用 random_shuffle(b,e,m， 随 机 数 发 生 器 接受 序列 (或 
子 序列 ) 的 元 素数 作为 其 实 参 。 例 如 ， 若 调用 r(e-b)， 则 发 生 器 必须 返回 [0,e-b) 间 的 值 。 如 
果 My_rand 是 一 种 随机 数 发 生 器 ， 我 们 可 以 这 样 洗 牌 : 

void f(deque<Card>& dc, My_rand& r) 


{ 
random_shuffle(dc.begin(),dc.end(),r); 


Wh 
} 


划分 算法 基于 某 种 划分 标准 将 序列 分 为 两 部 分 : 
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partition() (iso.25.3.15 ) 


p=partition(b,e,f) 将 满足 f(*p1) 的 元 素 置 于 区 间 [b:p) 内 ,将 其 他 元 素 置 于 区 间 [p:e) 内 
p=stable_partition(b,e,f) 将 满足 f(*p1) 的 元 素 置 于 区 间 [b:p) 内 ， 将 其 他 元 素 置 于 区 间 [p:e) 内 ; 保持 相 
对 顺序 


pair(p1,p2)=partition _ 将 [b:e) 中 满足 f(*p) 的 元 素 拷贝 到 [out1:p1) 内 ， 将 [b:e) 中 满足 !f(*p) 的 元 素 
copy(b,e,out1,out2,f) 拷贝 到 [out2:p2) 内 


p=partition_point(b,e,f) 对 [b:e)，p 指向 满足 all_of(b,p,f) 且 none_of(p,e ,f) 的 位 置 
is_partitioned(b,e,f) [b:e) 中 满足 f(*p) 的 元 素 都 在 满足 !f(*p) 的 元 素 之 前 吗 ? 
32.5.5 ”排列 


排列 算法 提供 了 生成 一 个 序列 所 有 排列 的 系统 方法 : 


排列 (iso.25.4.9，iso.25.2.12 ) 
若 next_* 操作 成 功 ，x 为 true， 否 则 为 false 


x=next_permutation(b,e) 将 [b:e) 变换 为 字典 序 上 的 下 一 个 排列 
x=next_permutation(b,e,f) 将 [b:e) 变换 为 字典 序 上 的 下 一 个 排列 ; 用 ff 比较 元 素 
x=prev_permutation(b,e) 将 [b:e) 变换 为 字典 序 上 的 前 一 个 排列 
x=prev_permutation(b,e,f) 将 [b:e) 变换 为 字典 序 上 的 前 一 个 排列 ; 用 f 比较 元 素 
is_permutation(b,e,b2) [b2:b2+(e-b)) 是 [b:e) 的 一 个 排列 ? 
is_permutation(b,e,b2,f) [b2:b2+(e-b)) 是 [b:e) 的 一 个 排列 ? 用 f(*p,*q) 比较 元 素 


我 们 通常 用 排列 来 生成 序列 中 元 素 的 组 合 。 例 如 ，abc 的 排列 为 acb 、bac、bca、cab 和 cba。 
算法 next_permutation() 接受 一 个 序列 [b:e)， 将 其 变换 为 下 一 个 排列 。“ 下 一 个 ”的 

定义 基于 这 样 一 个 假设 : 所 有 排列 已 按 字典 序 排序 。 如 果 存 在 “下 一 个 ”排列 ，next_ 

permutation() 返回 true ; 否则 ， 它 将 序列 变换 为 最 小 的 排列 ， 即 ， 升 序 中 排 在 第 一 位 的 排 

列 (在 上 例 中 是 abc)， 并 返回 false。 因 此 ， 我们 可 以 这 样 生 成 abc 的 所 有 排列 : 
Vector<char> v {'a','b','c'y; 


while(next_permutation(v.begin(),v.end())) 
cout << v[f0] << v[1] << v[2] << ”; 


类 似 地 ， 如 果 [b:e) 中 已 经 包含 第 一 个 排列 (上 例 中 的 abc)，prev_permutation() 返回 
false; 在 此 情况 下 ， 它 将 [b:e) 变换 为 最 后 一 个 排列 (上 例 中 的 cba ) 。 


32.5.6 fill() 
fill() 系列 算法 提供 了 向 序列 元 素 赋值 和 初始 化 元 素 的 方法 : 


fill 系列 算法 (iso.25.3.6，iso.25.3.7，iso.20.6.12 ) 











fill(b,e,v) 将 v 赋予 [b:e) 中 的 每 个 元 素 

p=fill_n(b,n,v) 将 v 赋予 [b:b+n) 中 的 每 个 元 素 ; p=b+n 

generate(b,e,f) 将 fl) 赋予 [b:e) 中 的 每 个 元 素 

p=generate_n(b,n,f) 将 f() 赋予 [b:b+n) 中 的 每 个 元 素 ; p=b+n 

uninitialized_fill(b,e,v) 将 [b:e) 中 的 每 个 元 素 初 始 化 为 v 

p=uninitialized_fill_n(b,n,v) 将 [b:b+n) 中 的 每 个 元 素 初始 化 为 v; p=b+n 
p=uninitialized_copy(b,e,out) 将 [out:out+(e-b)) 中 每 个 元 素 初 始 化 为 [b:e) 中 对 应 元 素 ; p=out+(e-b) 


p=uninitialized_copy_n(b,n,out) 将 [out:out+n) 中 每 个 元 素 初 始 化 为 [b:b+n) 中 对 应 元 素 ; p=out+n 
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fill() 算法 反复 用 指定 值 进 行 赋值 ， 而 generate() 则 通过 反复 用 调用 其 函数 实 参 得 到 的 值 进 
行 赋值 。 例 如 ， 使 用 将 在 40.7 节 中 介绍 的 随机 数 发 生 器 Randint 和 Urand: 


int v1[900]; 
array<int,900> v2; 
vector v3; 


void f() 

4 
fill(begin(v1),end(v1),99); /将 vl 的 所 有 元 素 设置 为 99 
generate(begin(v2),end(v2),Randint{}); 咱 设 置 为 随机 值 ( 见 40.7 节 ) 


儿 输 出 200 个 值 在 [0:100) 间 的 随机 整数 
generate_n(ostream_iterator<int>{cout},200,Urand{100}); 。 W/W/ 见 40.7 节 


fil_n(back_inserter{v3},20,99); 儿 将 20 个 值 为 99 的 元 素 添加 到 v3 中 

} 
generate() 和 fill() 函数 进行 赋值 而 非 初始 化 。 如 果 你 希望 操纵 原始 存储 ， 比 如 ， 将 一 块 内 
存 区 域 转化 为 有 着 定义 良好 的 类 型 和 状态 的 对 象 ， 则 可 使 用 uninitialized_ 版 本 (定义 在 
<memory> 中 )。 

未 初始 化 的 序列 只 应 出 现在 最 底层 的 编程 中 ， 通 常 是 在 容器 实现 的 内 部 。uninitialized_ 
fill() 或 uninitialized_copy() 的 目标 元 素 必 须 是 内 置 类 型 或 是 未 初始 化 的 。 例 如 : 

vector<string> vs {"Breugel"，"EI Greco","Delacroix","Constable")}; 

vector<string> vs2 {"Hals","Goya","Renoir","Turner"); 

copy(vs.begin(),vs.end(),vs2.begin()); // 正确 

uninitialized_copy(vs.begin(),vs.end(),vs2.begin()); 儿 内 存 泄漏 ! 


处 理 未 初始 化 内 存 的 更 多 方法 见 34.6 节 。 
32.5.7 swap!() 


swap() 算法 交换 两 个 对 象 的 值 : 
swap 系列 算法 (iso.25.3.3 ) 
swap(x,y) 交换 x 和 yy 的 值 
p=swap_ranges(b,e ,b2) 对 [b:e) 和 [b2:b2+(e-b)) 中 的 所 有 相应 元 素 v 和 v2 调用 swap(v,v2) 
iter_swap(p,q) swap(*p,*q) 
例如 : 
void use(vector<int>& v, int* p) 
{ 


swap_ranges(vbegin(),vend(),p); // 交换 值 
} 


指针 p 应 指向 一 个 数组 ， 其 中 至 少 包含 vsize() 个 元 素 。 

算法 swap() 可 能 是 标准 库 中 最 简单 但 也 最 重要 的 算法 。 它 被 用 于 很 多 广泛 使 用 的 算法 
的 实现 中 。 它 的 实现 在 7.7.2 节 中 被 作为 一 个 示例 ， 其 标准 库 版 本 将 在 35.5.2 节 中 介绍 。 
32.6 排序 和 搜索 


排序 和 已 排序 序列 中 的 搜索 是 非常 基础 的 操作 ， 而 程序 员 对 这 两 个 操作 的 需求 可 能 有 
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很 大 的 差异 。 默 认 的 比较 操作 是 < 运算 符 , 值 a 和 b 的 相等 性 通过 !(a<b)&&!(b<a) 来 判定 ， 
而 不 是 使 用 运算 符 ==。 


sort(b,e) 
sort(b,e,f) 


sort 系列 算法 (iso.25.4.1 ) 
排序 [b:e) 
排序 [b:e)， 用 fl*p,*q) 作为 比较 标准 


除了 “普通 排序 ”外 ,还 有 其 他 很 多 版 本 : 


stable_sort(b,e) 
stable_sort(b,e,f) 
partial_sort(b,m,e) 
partial_sort(b,m,e,f) 


p=partial_sort_copy(b,e,b2,e2) 
p=partial_sort_copy(b,e,b2,e2,f) 
is_sorted(b,e) 

is_sorted(b,e,f) 
p=is_sorted_until(b,e) 
p=is_sorted_until(b,e,f) 


nth_element(b,n,e) 


nth_element(b,n,e,f) 


sort 系列 算法 (iso.25.4.1 ) 

排序 [b:e)， 保 持 相 等 元 素 的 相对 顺序 

排序 [b:e)， 保 持 相等 元 素 的 相对 顺序 ， 用 fl*p,*q) 作为 比较 标准 

部 分 排序 [b:e)， 令 [b:m) 有 序 即 可 ，[m:e) 不 必 有 序 

部 分 排序 [b:e)， 令 [b:m) 有 序 即 可 ，[m:e) 不 必 有 序 ， 用 fl*p,*q) 作为 
比较 标准 

部 分 排序 [b:e)， 排 好 前 e2-b2 (或 前 e-b) 个 元 素 拷 贝 到 [b2:e2) ; p 为 
e2 和 b2+(e-b) 中 的 较 小 者 

部 分 排序 [b:e)， 排 好 前 e2-b2 (或 前 e-b) 个 元 素 拷贝 到 [b2:e2)， 用 f 
比较 元 素 ; p 为 e2 和 b2+(e-b) 中 的 较 小 者 

[b:e) 已 排序 ? 

[b:e) 已 排序 ? 用 f 比较 元 素 

p 指向 [b:e) 中 第 一 个 不 符合 升序 的 元 素 

p 指向 [b:e) 中 第 一 个 不 符合 升序 的 元 素 ， 用 f 比较 元 素 

*n 的 位 置 恰 好 是 [b:e) 排序 后 它 应 处 的 位 置 ; 即 [b:n) 中 的 元 素 都 <=*n 
且 [n:e) 中 的 元 素 都 >=*n 

*n 的 位 置 恰好 是 [b:e) 排序 后 它 应 处 的 位 置 ; 即 [b:n) 中 的 元 素 都 <=*n 
且 [n:e) 中 的 元 素 都 >=*n， 用 f 比较 元 素 


sort() 算法 要 求 随机 访问 迭代 器 ( 见 33.1.2 节 )。 
对 is_sorted_until()， 不 要 理会 它 的 名 字 ， 它 其 实 返 回 一 个 迭代 器 ， 而 不 是 一 个 bool。 
标准 库 list ( 见 31.3 节 ) 并 不 提供 随机 访问 和 迭代 器 ， 因 此 只 能 用 特殊 的 list 操作 ( 见 


template<typename List> 
void sort_list(List& lst) 
{ 


vector v {flst.begin(),lst.end()}; 


sort(v); 
copy(v,lst); 


31.4.2 节 ) 来 排序 list， 或 者 先 将 list 的 元 素 拷贝 到 一 个 vector 中 ， 排 序 这 个 vector， 然 后 
再 将 元 素 拷 回 list: 


/用 lst 进行 初始 化 
咱 使 用 容器 排序 ( 见 32.2 节 ) 


基础 的 sort() 很 高 效 (平均 时 间 复 杂 性 N*log(N))。 如 果 需 要 一 个 稳定 排序 算法 ， 可 使 用 
stable_sort()， 这 是 一 个 N*log(N)*log(N) 时 间 的 算法 ， 当 系统 有 足够 的 额外 内 存 时 ， 可 缩 
短 为 N*log(N)。 函 数 get_ temporary_buffer() 可 以 用 来 获取 额外 内 存 ( 见 34.6 节 )。stable_ 
sort() 可 以 保证 相等 元 素 的 相对 顺序 ，sort() 则 不 能 保证 。 

有 时 ,我 们 只 需要 有 序 序列 开始 部 分 的 元 素 。 在 此 情况 下 ， 按 用 户 需 求 进行 部 分 排序 ， 
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即 只 将 序列 前 一 部 分 整理 为 有 序 ， 就 是 有 意义 的 了 。 普 通 版 本 的 partial_sort(b,m,e) 算法 只 
整理 出 有 序 序列 [b:m) 间 的 部 分 。partial_sort_copy() 算法 生成 N 个 元 素 ，N 是 输出 和 输入 
序列 元 素数 中 较 小 的 那个 。 对 这 个 算法 ， 我 们 需要 指出 输出 序列 的 开始 和 结尾 ， 因 为 这 决定 
了 我 们 需要 排序 多 少 个 元 素 。 例 如 : 

void f(const vector<Book>& sales) // 找到 排名 前 十 的 书 


{ 
vector<Book> bestsellers(10); 
partial_sort_copy(sales.begin(),sales.end!(), 
bestsellers.begin(),bestseliers.end()， 
D(const Book& b1, const Book& b2) { return b1.copies_sold()>b2.copies_sold(); }); 
copy(bestsellers.begin(),bestsellers.end!(),ostream_iterator<Book>{cout,"\n"}); 
} 


由 于 partial_sort_copy() 的 目标 必须 是 一 个 随机 访问 迭代 器 ， 因 此 我 们 不 能 直接 将 排序 结果 
写 到 cout。 

如 果 需 要 由 partial_sort() 排序 的 元 素数 少 于 元 素 总 数 ， 这 些 算法 可 能 比 完全 sort() 快 
得 多 。 因 此 ， 它 们 的 时 间 复 杂 性 接近 O(N)， 而 sort() 的 复杂 性 为 O(N*log(N))。 

算法 nth_element() 只 需 将 升序 结果 中 排 在 第 n 位 的 元 素 放置 到 正确 位 置 即 可 ， 即 ， 之 
前 的 元 素 都 不 大 于 它 ， 之 后 的 元 素 都 不 小 于 它 。 例 如 : 

vector<int> v; 

for (int i=0; i<1000; ++i) 

v.push_back(randint(1000)); 儿 见 40.7 节 

constexpr int n = 30; 

nth_element(vbegin(), vbegin()+n, vend()); 

cout << "nth: "<<v[n] < \n 

for (int i=0; i<n; ++i) 

cout << v[i] <<""; 

这 有 段 代码 得 到 这 样 的 输出 : 

nth: 24 

10815192115876172121881932120181073381111222223 
nth_element() 与 partial_sort() 的 不 同 之 处 在 于 n 之 前 的 元 素 不 必 是 有 序 的 ， 都 小 于 等 于 第 
n 个 元 素 即 可 。 将 本 例 中 的 nth_element 替换 为 partial_sort (并 使 用 相同 的 种 子 以 便 随 机 数 
发 生 器 生成 相同 的 序列 )， 我 们 会 得 到 : 

nth: 995 

1233367788889101011111515171818 1920212121222223 
nth_element() 对 经 济 学 家 、 社 会 学 家 和 教师 这 些 人 群 特别 有 用 ， 他 们 经 常 求 中 位 数 、 百 分 
位 数 ， 等 等 。 

排序 C 风格 的 字符 串 需 要 一 个 显 式 的 比较 标准 。 原 因 在 于 C 风格 的 字符 串 只 是 简单 
的 字符 指针 ， 且 有 其 自己 的 使 用 规范 ， 指 针 上 的 < 其 实 是 比较 机 器 地 址 而 不 是 字符 序列 。 
例如 : 


vector<string> vs = {"Helsinki","Copenhagen","Oslo","Stockholm"}; 
vector<char*> vcs = {"Helsinki","Copenhagen","Oslo","Stockholm"}; 


void use() 


sort(vs); /我 已 经 定义 了 范围 版 本 的 sort() 
sort(vcs); 
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for (auto& x : vs) 
Cout <<x <<"" 

cout << "\n'; 

for (auto& x : vcs) 
cout <<x<<"'; 


这 段 代码 会 输出 : 
Copenhagen Helsinki Stockholm Oslo 
Helsinki Copenhagen Osio Stockholm 


我 们 自然 期 望 两 个 vector 的 排序 结果 相同 。 但 是 ， 为 了 让 C 风格 的 字符 串 排 序 比 较 的 是 字 
符 串 内 容 而 不 是 地 址 ， 我 们 需要 一 个 适合 的 排序 谓词 。 例 如 : 


sort(vcs, [](const char* p, const char* q){ return strcmp(p,q)<0; }); 


标准 库 函 数 strcmp() 将 在 43.4 节 中 描述 。 
注意 ， 我 不 必 提 供 一 个 == 来 排序 C 风格 的 字符 串 。 为 了 简化 用 户 接 口 ， 标 准 库 使 
用 !(x<y>||y<x) 而 不 是 x==y 来 比较 元 素 ( 见 31.2.2.2 节 )。 


32.6.1 二 分 搜索 
binary_search() 系列 算法 提供 了 有 序 序列 上 的 二 分 搜索 : 


二 分 搜索 (iso.25.4.3 ) 


p=lower_bound(b,e,v) p 指向 [b:e) 中 v 首次 出 现 的 位 置 
p=lower_bound(b,e,v,f) p 指向 [b:e) 中 v 首 次 出 现 的 位 置 ， 用 f 比较 元 素 
p=upper_bound(b,e,v) p 指向 [b:e) 中 第 一 个 大 于 v 的 元 素 
p=upper_bound(b,e,vf) p 指向 [b:e) 中 第 一 个 大 于 v 的 元 素 ， 用 f 比较 元 素 
binary_search(b,e,v) v 在 有 序 序列 [b:e) 中 吗 ? 

binary_search(b,e,v,f) v 在 有 序 序列 [b:e) 中 吗 ? 用 f 比较 元 素 


pair(p1,p2)=equal_range(b,e ,v) ”[p1:p2) 是 [b:e) 中 值 为 v 的 子 序 列 ; 通常 用 二 分 搜索 查找 v 
pair(p1,p2)=equal_range(b,e,vwf) ”[p1:p2) 是 [b:e) 中 值 为 v 的 子 序列 ， 用 f 比较 元 素 ; 通常 用 二 分 搜索 查找 v 


对 大 序列 而 言 ， 顺 序 搜索 如 find() ( 见 32.4 节 ) 可 能 性 能 很 差 .但 在 没有 做 排序 或 哈 希 ( 见 
31.4.3.2 节 ) 的 情况 下 ， 这 可 能 已 是 最 好 的 方法 了 。 但 一 旦 序列 已 排序 ， 我 们 就 可 以 用 二 分 
搜索 查找 元 素 了 。 例 如 : 

void f(vector<int>& c) 


if (binary_search(c.begin(),c.end(),7)){ /7 在 c 中? 
a 


} 
I.. 
} 

binary_search() 返回 一 个 bool 指出 给 定 值 是 否 在 序列 中 。 类 似 find()， 我 们 通常 还 想 知 道 
序列 中 哪个 元 素 具 有 此 值 。 但 是 ， 序 列 中 可 能 有 很 多 元 素 具 有 相同 的 值 ， 我 们 通常 希望 找 
到 这 些 元 素 中 的 第 一 个 或 是 所 有 。 因 此 ， 标准 库 提供 了 equal_range() 算法 来 查找 相等 元 素 
范围 ， 以 及 查找 此 范围 | ower_bound() 和 upper_bound() 的 算法 。 这 些 算法 对 应 multimap 
上 的 操作 ( 见 31.4.3 节 )。 我 们 可 以 将 lower_bound() 看 作 有 序 序列 上 的 快速 find() 和 find_ 
if()。 例 如 : 
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void g(vector<int>& c) 


auto p = find(c.begin(),c.end(),7); /| 可 能 很 慢 : O(N); c 无需 排序 
auto q = lower_bound(c.begin(),c.end(),7); 。 // 可 能 很 快 : O(log(N)); c 必须 排 好 序 
/| 


} 


车 lower_bound(first,last,k) 没有 找到 k， 它 返回 一 个 迭代 器 ， 指 向 第 一 个 大 于 的 元 素 ， 
或 者 返回 last 意味 着 所 有 元 素 都 不 大 于 k。 这 种 报告 失败 的 方式 也 被 upper_bound() 和 
equal_range() 所 采用 。 这 意味 着 我 们 可 以 用 这 些 算法 确定 一 个 新 元 素 在 一 个 有 序 序列 中 的 
正确 插入 位 置 : 恰好 在 返回 的 pair 的 second 所 指向 的 位 置 之 前 。 

很 奇怪 的 是 : 二 分 搜索 算法 不 需要 随机 访问 迭代 器 : 一 个 前 向 迭代 器 就 够 了 。 


32.6.2 merge() 
merge 算法 将 两 个 有 序 序 列 合 并 为 一 个 : 


merge 系列 算法 (iso.25.4.4 ) 


p=merge(b,e,b2,e2,out) 合并 两 个 有 序 序列 [b2:e2) 与 [b:e)， 结 果 写 人 [out:p) 

p=merge(b,e,b2,e2,0ut,f) 合并 两 个 有 序 序列 [b2:e2) 与 [b:e)， 结 果 写 人 [out:out+p)， 用 f 比较 元 素 

inplace_merge(b,m,e) 原址 合并 一 一 将 两 个 有 序 子 序列 [b:m) 与 [m:e) 合并 为 有 序 序列 [b:e) 

inplace_merge(b,m,e,f) 原址 合并 一 一 将 两 个 有 序 子 序列 [b:m) 与 [m:e) 合并 为 有 序 序列 [b:e)， 用 
f 比较 元 素 


merge() 算法 可 以 接受 不 同类 别 的 序列 和 不 同类 型 的 元 素 。 例 如 : 


vector<int> v {3,1,4,2}; 
list<double> lst {0.5,1.5,2,2.5}; 中 lst 有 序 


sort(vbegin(),vend()); /排序 v 


vector<double> v2; 


merge(vbegin(),vend(),lst.begin(),lst.end(),back_inserter(v2));  // 合 并 v 和 1]st 写 入 v2 
for (double x : v2) 
Cout <<x <<","; 


插入 器 请 见 33.2.2 节 。 这 段 代码 输出 为 : 
0.5, 1, 1.5, 2, 2, 2.5, 3, 4, 
32.6.3 ”集合 算法 


这 些 算法 将 序列 当 作 一 个 元 素 集合 来 处 理 ， 并 提供 基本 的 集合 操作 。 输 入 数列 应 是 排 好 
序 的 ， 输 出 序列 也 会 被 排序 : 


集合 算法 (iso.25.4.5 ) 


includes(b,e,b2,e2) [b:e) 中 的 所 有 元 素 也 都 在 [b2:e2) 中 ? 

includes(b,e,b2,e2,f) [b:e) 中 的 所 有 元 素 也 都 在 [b2:e2) 中 ?用 f 比较 元 素 

p=set_union(b,e,b2,e2,out) 创建 一 个 有 序 序列 [out:p)， 包 含 [b:e) 和 [b2:e2) 中 的 所 有 
元 素 

p=set_union(b,e,b2,e2,out,f) 创建 一 个 有 序 序列 [out:p)， 包 含 [b:e) 和 [b2:e2) 中 的 所 有 


元 素 ， 用 f 比较 元 素 
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( 续 ) 

p=set_intersection(b,e,b2,e2,out) 创建 一 个 有 序 序列 [out:p)， 包 含 [b:e) 和 [b2:e2) 中 的 共同 
元 素 

p=set_intersection(b,e,b2,e2,out,f) 创建 一 个 有 序 序列 [out:p)， 包含 [b:e) 和 [b2:e2) 中 的 共同 
元 素 ， 用 f 比较 元 素 

p=set_difference(b,e,b2,e2,out) 创建 一 个 有 序 序 列 [out:p)， 其 元 素 在 [b:e) 中 但 不 在 
[b2:e2) 中 

p=set_difference(b,e,b2,e2,0ut,f) 创建 一 个 有 序 序列 [out:p)， 其 元 素 在 [b:e) 中 但 不 在 


[b2:e2) 中 ， 用 f 比较 元 素 
p=set_symmetric_difference(b,e,b2,e2,0ut) 创建 一 个 有 序 序列 [out:p)， 其 元 素 在 [b:e) 中 或 [b2:e2) 中 ， 
但 不 同时 在 两 者 中 
p=set_symmetric_difference(b,e ,b2,e2,outif) ”创建 一 个 有 序 序列 [out:p)， 其 元 素 在 [b:e) 中 或 [b2:e2) 中 ， 
但 不 同时 在 两 者 中 ， 用 f 比较 元 素 


例如 : 


string s1 = "qwertyasdfgzxcvb"; 

string s2 = "poiuyasdfg/.,mnb"; 

sort(s1.begin(),s1.end()); 儿 集 合算 法 要 求 序列 有 序 
sort(s2.begin(),s2.end()); 


string s3(s1.size()+s2.size(),*"); // 为 最 大 的 可 能 结果 留 出 足够 的 空间 
cout << S3 << \m 
auto up = set_union(s1.begin(),s1.end(),s2.begin(),s2.end(),s3.begin()); 
cout << S3 << \n'; 
for (auto p = s3.begin(); p!=up; ++p) 

cout << *p; 
cout << \n'; 


s3.assign(s1.size()+s2.size(),'+"); 

up = set_difference(s1.begin(),s1.end(),s2.begin(),s2.end(),s3.begin()); 
cout << s3 << \n ; 

for (auto p = s3.begin(); p!=up; ++p) 


Cout << *pi; 
cout << \n'; 
这 个 小 测试 会 输出 : 


类 宁 闵 六 六 六 六 六 米 米 玉米 闵 闵 素 冰 六 闵 玉 寄 六 这 米 闵 冰 玉米 闵 闵 玉 六 


,labcdefgimnopqrstuvxyz 
CeqrtvWXZ+ 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 


ceqrtvwxz 


32.6.4 堆 


堆 是 一 种 按 最 大 值 优先 的 方式 组 织 元 素 的 紧凑 数据 结构 。 你 可 以 将 堆 想 象 为 一 种 二 又 树 
表示 方式 。 堆 算法 允许 程序 员 将 一 个 随机 访问 序列 作为 堆 处 理 : 


堆 操作 (iso.25.4.6 ) 
make_heap(b,e) 将 [b:e) 整理 为 一 个 堆 
make_heap(b,e,f) 将 [b:e) 整理 为 一 个 堆 ， 用 f 比较 元 素 
push_heap(b,e) 将 *(e-1) 添加 到 堆 [b:e-1) 中 ,使 得 [b:e) 还 是 一 个 堆 

















( 续 ) 

堆 操作 (iso.25.4.6 ) 
push_heap(b,e,f) 添加 元 素 到 堆 [b:e-1) 中 ， 用 ff 比较 元 素 
pop_heap(b,e) 从 堆 [b:e) 中 删除 最 大 值 (*b， 与 *(e-1) 交换 后 删除 *(e-1))，[b:e-1) 保持 堆 结 构 
pop_heap(b,e,f) 从 堆 [b:e) 中 删除 元 素 ， 用 了 比较 元 素 
sort_heap(b,e) 排序 堆 [b:e) 
sort_heap(b,e,f) 排序 堆 [b:e)， 用 f 比较 元 素 
is_heap(b,e) [b:e) 是 一 个 堆 吗 ? 
is_heap(b,e,f) [b:e) 是 一 个 堆 吗 ? 用 f 比较 元 素 





p=is_heap_until(b,e) p 是 满足 [b:p) 是 堆 的 最 大 位 置 
p=is_heap_until(b,e,f) p 是 满足 [b:p) 是 堆 的 最 大 位 置 ， 用 f 比较 元 素 


将 堆 [b:e) 的 末尾 位 置 e 想象 为 一 个 指针 ，pop_heap() 会 使 它 递减 ，push_heap() 会 使 它 递 
增 。 读 取 b ( 即 x=*b) 然后 执行 pop_heap() 即 可 抽取 出 最 大 元 素 。 写 人 e ( 即 *e=x) 然后 
执行 push_heap() 即 可 插入 新 元 素 。 例 如 


string s = "herewego"; 

make_heap(s.begin(),s.end()); Jl rogheeew 
pop_heap(s.begin(),s.end()); ll rogheeew 
pop_heap(s.begin(),s.end()-1); ll ohgeeerw 
pop_heap(s.begin(),s.end()-2); /| hegeeorw 


*(s.end()-3)="f'; 
push_heap(s.begin(),s.end()-2);  // hegeefrw 
#(S.end()-2)='X 
push_heap(s.begin(),s.end()-1);  //xeheefge 
*(s.end()-1)='y’; 


push_heap(s.begin(),s.end()); /| yxheefge 
sort_heapl(s.begin(),s.end()); ll eeefghxy 
reverse(s.begin(),s.end()); ll yxhgfeee 


理解 s 是 如 何 改变 的 一 种 方法 是 : 用 户 只 能 从 s[0] 读 ， 只 能 向 s[x] 写 ，x 是 当前 堆 末 尾 的 下 
标 。 从 堆 中 删除 元 素 (总 是 删除 s[0]) 是 通过 将 它 与 s[x] 交换 来 实现 的 。 

堆 的 关键 特点 是 提供 了 快速 插入 新 元 素 和 快速 访问 最 大 元 素 的 能 力 。 堆 的 最 主要 用 途 是 
实现 优先 队列 。 





32.6.5 lexicographical_compare() 
字典 序 比较 就 是 我 们 用 来 排序 字典 中 单词 的 规则 。 


字典 序 比较 (iso.25.4.8 ) 
lexicographical_compare(b,e,b2,e2) [b:e)<[b2:e2)? 
lexicographical_compare(b,e,b2,e2,f) [b:e)<[b2:e2)? 用 f 比较 元 素 


我 们 可 以 这 样 实现 lexicographical_compare(b,e,b2,e2): 


template<class In, class In2> 
bool lexicographical_compare(In first, in last, In2 first2, In2 last2) 


for (; first!=last && first2!=last2; ++first,++last) { 
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if (*first<*first2) 
return true; 

if (*first2<*first) 
return false; 








I [first:last)<[first2:last2) 


I [first2:last2)<[first:last) 


return first==last && first2!=iast2; // 若 [first:last) 更 短 ，[first:last)<[first2:last2) 


} 


即 ， 字 符 串 被 当 作 字符 序列 进行 比较 。 例 如 : 


string n1{ 人 "10000”}; 
string n2 {"999"); 


bool b1 = lexicographical_compare(n1.begin(),n1.end(),n2.begin(),n2.end()); lI b1 一 ture 


n1 = "Zebra"; 
n2 = "Aardvark"; 


bool b2 = lexicographical_compare(n1.begin(),n1.end(),n2.begin(),n2.end()); ll b2==false 


32.7 最 大 值 和 最 小 值 


这 是 一 组 在 很 多 场景 中 都 很 有 用 的 值 比较 算法 : 


min 和 max 系列 算法 (iso.25.4.7 ) 





x=min(a,b) 
x=min(a,b,f) 
x=min({elem}) 
x=min({elem},f) 
x=max(a,b) 
x=max(a,b,f) 
x=max({elem}) 
x=max({elem)},f) 


x 是 a 和 b 中 的 较 小 者 

x 是 a 和 b 中 的 较 小 者 ， 用 f 比较 元 素 

x 是 {elem} 中 的 最 小 元 素 

x 是 {elem} 中 的 最 小 元 素 ， 用 f 比较 元 素 
x 是 a 和 b 中 的 较 大 者 

x 是 a 和 b 中 的 较 大 者 ， 用 f 比较 元 素 

x 是 {elem} 中 的 最 大 元 素 

x 是 {elem} 中 的 最 大 元 素 ， 用 f 比较 元 素 





pair(x,y)=minmax(a,b) 
pair(xy)=minmax(a,b,f) 
pair(x,y)=minmax({elem}) 
pair(x,y)=minmax({elem},f) 
p=min_element(b,e) 
p=min_element(b,e,f) 
p=max_element(b,e) 
p=max_element(b,e,f) 
pair(x,y)=minmax_element(b,e) 


pair(x,y)=minmax_element(b,e,f) 


Xx 为 min(a,b), y 为 max(a,b) 

Xx 为 min(a,b,f)，y 为 max(a,b,f) 

XxX 为 min({elem}), y 为 max({elem}) 

x 为 min({elem},f), y 为 max({elem)},f) 

p 指向 [b:e) 中 的 最 小 元 素 或 e 

p 指向 [b:e) 中 的 最 小 元 素 或 e， 用 f 比较 元 素 

p 指向 [b:e) 中 的 最 大 元 素 或 e 

p 指向 [b:e) 中 的 最 大 元 素 或 e， 用 f 比较 元 素 

x 为 min_element(b,e), y 为 max_element(b,e) 

Xx 为 min_element(b,e,f), y 为 max_element(b,e,f) 


如 果 比 较 两 个 左 值 ， 返 回 的 是 指向 结果 的 引用 ; 否则 ,返回 一 个 右 值 。 但 是 ， 接 受 左 值 的 版 
本 接受 的 是 const 左 值 ， 因 此 你 永远 不 能 修改 这 些 函 数 的 返回 结果 。 例 如 : 


int x = 7; 
int y = 9; 


++min(x,y); 。 /N/min(x;y) 的 结果 是 一 个 const int& 
++min({X,y}); /错误 : min({x,y}) 的 结果 是 一 个 右 值 (initializer list 是 不 可 变 的 ) 
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_element 系列 函数 返回 迭代 器 ，minmax 函数 返回 pair， 因 此 我 们 可 以 这 样 编写 代码 : 


string s = "Large_Hadron_Collider ; 
autop = minmax_element(s.begin(),s.end()， 


[l(char cf,char c2) { return toupper(c1)<toupper(c2); }); 


cout << "min==" << +(p.first) << '' << "max==" << *(p.second) << "\n’; 


由 于 我 的 机 器 采用 ASCII 字符 编码 ， 因 此 这 个 小 测试 程序 会 输出 : 


min==a max==_ 


32.8 建议 


1 
[2] 
[3] 
[4] 
[5] 
[6] 
[7] 
[8 











STL 算法 操作 一 个 或 多 个 序列 ; 32.2 节 。 

一 个 输入 序列 是 一 个 半 开 区 间 ， 由 一 对 迭代 器 定义 ; 32.2 节 。 

进行 搜索 时 ， 算 法 通常 返回 输入 序列 的 末尾 位 置 表示 “未 找到 ”; 32.2 节 。 
优选 精心 说 明 的 算法 而 非 “ 随 意 代码 ”; 32.2 节 。 

当 你 要 编写 一 个 循环 时 ， 思 考 它 是 否 可 以 表达 为 一 个 通用 算法 ; 32.2 节 。 
确保 一 对 迭代 器 实 参 确实 指定 了 一 个 序列 ; 32.2 节 。 

当 和 迭代 器 对 风格 显得 完 长 时 ， 引 入 容器 /范围 版 本 的 算法 ; 32.2 节 。 

用 谓词 和 其 他 函数 对 象 赋予 标准 算法 更 宽泛 的 含义 ; 32.3 节 。 

谓词 不 能 修改 其 实 参 ; 32.3 节 。 


] 指针 上 默认 的 == 和 < 极 少 能 满足 标准 算法 的 需求 ; 32.3 节 。 


了 解 你 使 用 的 算法 的 时 间 复 杂 性 ， 但 要 记 住 复杂 性 评价 只 是 对 性 能 的 粗略 导 引 ; 
32.3.1 节 。 
只 在 对 一 个 任务 没有 更 专用 的 算法 时 使 用 for_each() 和 transform(); 32.4.1 节 。 


] 算法 并 不 直接 向 其 实 参 序列 添加 元 素 或 从 其 中 删除 元 素 ; 32.5.2 节 、32.5.3 节 。 


如 果 不 得 不 处 理 未 初始 化 的 对 象 ， 考 虑 uninitialized_* 系列 算法 ; 32.5.6 节 。 
STL 算法 基于 其 排序 比较 操作 实现 相等 性 比较 ， 而 不 是 使 用 ==; 32.6 节 。 


] 注意 ， 排 序 和 搜索 C 风格 的 字符 串 要 求 用 户 提 供 一 个 字符 串 比较 操作 ; 32.6 节 。 
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STL 容器 和 算法 之 间 如 此 协调 的 原因 ， 是 它们 相互 之 间 一 无 所 知 。 
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e 引言 
e 迭代 器 模型 
迭代 咒 类 别 ; 和 迭代 器 萃取 ; 迭代 器 操作 
e 和 迭代 器 适配器 
反 向 迭代 器 ; 插入 迭代 器 ; 移动 迭代 器 
。 范围 访问 函数 
e 函数 对 象 
e 函数 适配器 
bind(); mem_fn(); function 
e 建议 
33.1 引言 
本 章 介 绍 STL 迭代 器 及 相关 工具 ， 特 别 是 标准 库 函 数 对 象 。STL 包含 标准 库 中 的 迭代 
器 、 容 器 、 算 法 和 函数 对 象 几 个 部 分 。STL 的 其 他 内 容 在 第 31 章 和 第 32 章 介绍 。 


和 迭代 器 是 标准 库 算 法 和 所 操作 的 数据 间 的 黏合 剂 。 反 过 来 ， 也 可 以 说 和 迭代 器 机 制 是 为 了 
最 小 化 算法 与 所 操作 的 数据 结构 间 的 依赖 性 : 


sort() find() mergel()... my_algo() your fct() 
迭代 器 
vector map list .. my_container your_container 
33.1.1 和 迭代 器 模型 


与 指针 类 似 ， 和 迭代 器 提供 了 间接 访问 的 操作 〈 如 解 引用 操作 *) 和 移动 到 新 元 素 的 操作 
(例如 ，++ 操作 移动 到 下 一 个 元 素 )。 一 对 和 迭代 器 定义 一 个 半 开 区 间 [begin:end)， 即 所 谓 序 


列 (sequence): 


迭代 器 : begin end 


5 下 
即 ，begin 指向 序列 的 首 元 素 ，end 指向 序列 尾 元 素 之 后 的 位 置 。 永 远 也 不 要 从 *end 读 取 








和 


数据 ， 也 不 要 向 它 写 信 数据。 注意 ， 空 序列 满足 begin==end ; 即 ， 对 任意 迭代 器 p 都 有 
[p:p) 是 空 序列 。 

为 了 读 取 一 个 序列 ， 算 法 通常 接受 一 对 表示 半 开 区 间 [begin:end) 的 迭代 器 (b,e)， 并 使 
用 ++ 遍历 序列 直至 到 达 末 尾 : 


while (bl=e){ 儿 用 上 = 而 不 是 < 
/进行 一 些 操作 
++b; // 移动 到 下 一 个 元 素 

} 


我 用 != 而 不 是 < 判断 是 否 到 达 序 列 尾 ， 部 分 原因 是 这 更 为 精确 ， 还 有 部 分 原因 是 只 有 随机 
访问 迭代 器 才 支持 <。 

在 序列 中 搜索 数据 的 算法 通常 返回 序列 尾 表 示 “ 未 找到 ”; 例如 : 

auto p = find(v.begin(),v.end(),x); // 在 v 中 查找 x 

if (p!=v.end()) { 


/在 位 置 p 找到 x 
} 


else{ 
/1 在 [v.begin():V.end()) 中 未 找到 x 
} 
向 序列 写 人 数据 的 算法 通常 只 接受 指向 序列 首 元 素 的 单一 迭代 器 。 在 此 情况 下 ， 保 证 不 超出 
序列 尾 是 程序 员 的 责任 。 例 如 : 


template<typename lter> 
void forward(lter p, int n) 





while (n>0) 
*p++ fy 
} 
void user() 
{ 
vector<int> v(10); 
forward(vbegin(),v.size()); // 正确 
forward(v.begin(),1000); 中 大 麻烦 
} 


某 些 标准 库 实现 了 范围 检查 一 一 即 ， 最 后 一 个 forward() 调用 会 抛 出 一 个 异常 一 一 但 出 于 代 
码 可 移植 性 的 考虑 ， 你 不 应 依赖 这 一 特性 : 很 多 实现 并 不 进行 范围 检查 。 一 种 简单 而 又 安全 
的 替代 方案 是 使 用 插入 迭代 器 ( 见 33.2.2 节 )。 


33.1.2 ”迭代 器 类 别 


标准 库 提供 了 5 种 迭代 器 (5 个 迭代 器 类 别 ，iterator category): 

@ 输入 迭代 器 (input iterator): 利用 输入 迭代 器 ， 我 们 可 以 用 ++ 向 前 遍历 序列 并 用 六 ( 反 
复 ) 读 取 每 个 元 素 。 我 们 可 以 用 == 和 != 比较 输入 迭代 器 。istream 提供 了 这 种 迭代 
器 ; 请 见 38.5 节 。 

e 输出 迭代 器 ( output iterator) : 利用 输出 迭代 器 ， 我 们 可 以 用 ++ 向 前 遍历 序列 并 用 * 
每 次 写 人 一 个 元 素 。ostream 提供 了 这 种 迭代 器 ; 请 见 38.5 节 。 

@ 前 向 迭代 器 ( forward iterator) : 利用 前 向 和 迭代 器 ， 我 们 可 以 反复 使 用 ++ 向 前 遍历 序 
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列 并 用 * 读 写 元 素 (除非 元 素 是 const 的 )。 如 果 一 个 前 向 迭代 器 指向 一 个 类 对 象 ， 
我 们 可 以 用 -> 访问 其 成 员 。 我 们 可 以 用 == 和 != 比较 前 向 迭代 器 。forward_list 提 
供 了 这 种 迭代 器 ; 请 见 31.4 节 。 

双向 和 迭代 器 (bidirectional iterator): 利用 双向 迭代 器 ， 我 们 可 以 向 前 (用 ++) 和 向 后 
(用 --) 遍历 序列 并 用 * (反复 ) 读 写 元 素 (除非 元 素 是 const 的 )。 如 果 一 个 双向 迭代 
器 指向 一 个 类 对 象 ， 我 们 可 以 用 -> 访问 其 成 员 。 我 们 可 以 用 == 和 1= 比较 双向 迭代 
器 。list、map 和 set 提供 了 这 种 迭代 器 ( 见 31.4 节 )。 

随机 访问 迭代 器 ( random-access iterator) : 利用 双向 迭代 器 ， 我 们 可 以 向 前 (用 ++ 
或 +=) 和 向 后 (用 -- 或 -=) 遍历 序列 并 用 * 或 [反复 读 写 元 素 (除非 元 素 是 const 
的 )。 如 果 一 个 随机 访问 和 迭代 器 指向 一 个 类 对 象 ， 我 们 可 以 用 -> 访问 其 成 员 。 对 一 个 
随机 访问 迭代 器 ， 我 们 可 以 用 口 进行 下 标 操作 ， 用 + 加 上 一 个 整数 ， 以 及 用 - 减 去 
一 个 整数 。 我 们 可 以 将 指向 同一 个 序列 的 两 个 随机 访问 迭代 器 相 减 来 获得 它们 的 距 
离 。 我 们 可 以 用 ==、!=、<、<=、> 和 >= 比较 双向 迭代 器 。vector 提供 了 这 种 迭代 
器 ( 见 31.4 节 )。 

逻辑 上 ， 这 些 迭 代 器 组 织 为 一 个 层次 〈 见 iso.24.2 ): 





碗 代 器 


* 、 十 十 





输入 迭代 器 | 输出 兴 代 器 
、- 单一 写 








| 前 向 迭代 器 
反复 读 写 


双向 迭代 器 








随机 访问 迭代 器 
+、4=、-、 一 、E、c、>、2= 


这 些 迭 代 器 类 别 是 概念 ( 见 24.3 节 ) 而 非 类 ， 因 此 这 个 层次 并 非 用 继承 实现 的 类 层次 。 如 果 
你 希望 用 迭代 器 类 别 做 一 些 更 进 阶 的 事情 ， 可 (直接 或 间接 ) 使 用 iterator_traits 。 
33.1.3 和 挝 代 器 蔗 取 


在 <iterator> 中 ,标准 库 提供 了 一 组 类 型 函数 ， 允 许 我 们 编写 用 于 迭代 器 特定 属性 的 专 
用 代码 : 








迭代 器 萃取 (iso.24.4.1 ) 


iterator_traits<lter> 非 指针 lter 的 茶 取 类 型 

iterator_traits<T*> 指针 T* 的 萃取 类 型 

iterator<Cat,T,Dist,PtrRe> 定义 了 基本 迭代 器 成 员 类 型 的 简单 类 

input_iterator_tag 输入 迭代 器 类 别 

output_iterator_tag 输出 迭代 器 类 别 

forward_iterator_tag 前 向 迭代 器 类 别 ; 派生 自 input_iterator_tag ; 为 forward_list、unordered_ 


set、unordered_multiset、unordered_map 和 unordered_multimap 提供 
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( 续 ) 
迭代 器 萃取 (iso.24.4.1 ) 
bidirectional_iterator_tag 双向 迭代 器 类 别 ; 派生 自 forward_iterator_tag ; 为 list、set、multiset、 
map 和 multimap 提供 
random_access_iterator_tag 随机 访问 迭代 器 类 别 ; 派生 自 bidirectional_iterator tag ; 为 vector、 


deque、array、 内 置 数组 和 string 提供 


迭代 需 标 签 的 本 质 是 类 型 ， 用 来 基于 迭代 器 类 型 选择 算法 。 例 如 ， 一 个 随机 访问 迭代 器 可 以 
直接 定位 元 素 : 
template<typename lter> 


void advance_helperllter p, int n, random_access_iterator_ tag) 


{ 


} 
另 一 方面 ， 为 了 用 一 个 前 向 迭代 器 定位 第 n 个 元 素 ， 只 能 一 次 移动 一 个 元 素 (例如 ， 通 过 链 
表 中 的 链接 移动 ): 


template<typename lter> 
void advance_helper(iter p, int n, forward_iterator_tag) 


p+=n; 


{ 
if (0<n) 
while (n--) ++p; 
else if (n<0) 
while (n++) —~p; 
} 


有 了 这 些 辅 助 函数 ，advance() 就 可 以 一 致 地 使 用 最 优 算法 : 


template<typename lter> 
void advancellter p, int n) 儿 使 用 最 优 算法 
{ 


} 


典型 情况 下 ，advance() 或 advance_helper() 会 被 优化 为 内 联 消 数 ， 以 确保 这 种 标签 分 发 
(tag dispatch) 技术 不 会 引入 运行 时 额外 开销 。 这 种 技术 及 其 变 体 在 STL 中 被 广泛 使 用 。 
iterator_traits 中 的 别名 描述 了 和 迭代 器 的 关键 属性 : 


template<typename liter> 

struct iterator traits { 
using value_type = typename lter::value_type; 
using difference_type = typename lter::difference_type; 
using pointer = typename lter::pointer; 儿 指针 类 型 
using reference = typename lter::reference; /引用 类 型 
using iterator_category = typename lter::iterator_category; // (标签 ) 


advance_helper(p,n,typename iterator traits<lter>::iterator_category{}); 


}; 
对 于 没有 这 些 成 员 类 型 的 迭代 器 (如 int*) 来 说 ， 我 们 提供 了 iterator_traits 的 一 个 特例 化 
版 本 : 
template<typename T> 
struct iterator_traits<T*> { 儿 针对 指针 的 特例 化 版 本 
using difference_type = ptrdiff_t; 


using value_type =T; 
using pointer = T+*; 
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using reference = T& reference; 
using iterator_category = random_access_iterator_tag; 
上》 
我 们 不 能 编写 下 面 这 样 的 通用 函数 : 
template<typename lter> 


typename iter::value_type read(lIter p, int n) /不 是 通用 的 
{ 

外 … 进行 一 些 检查 … 

return p[n]; 


{ 
这 段 代 码 隐 藏 着 一 个 错误 。 传 递 给 read() 一 个 指针 实 参 会 导致 错误 。 编 译 器 会 捕获 这 个 错 
误 , 但 错误 消息 可 能 元 长 隐 了 星 。 取 而 代 之 ,我 们 可 以 这 样 编写 read(): 


template<typename lter> 
typename iterator_traits<lter>::value_type read(lter p, int n) 咱 更 通用 


{ 
咱 .… 进行 一 些 检查 … 
return p[n]; 


关键 思路 是 ， 为 了 获得 迭代 器 的 属性 ， 你 应 该 访问 其 iterator_traits ( 见 28.2.4 节 ) 而 不 是 
和 迭代 器 本 身 。 为 了 避免 直接 访问 iterator_traits， 毕 竞 它 属于 实现 细节 ， 我 们 可 以 定义 别名 。 
例如 : 

template<typename lter> 


using Category<lter> = typename std::iterator traits<lter>::iterator_category; 


template<typename lter> 
using Difference_type<iter> = typename std::iterator traits<lter>::difference_type; 


因此 ， 如 果 我 们 想 了 解 两 个 (指向 同一 个 序列 的 ) 迭代 器 间 的 距离 是 什么 类 型 ， 可 以 这 样 纺 
写 代码 : 


tempate<typename lter> 
void fllter p, iter q) 


Iter::difference_type d1 = distance(p,q); 咱 语法 错误 : 漏 掉 了 “typename” 
typename iter::difference_type d2 = distance(p,q); /不 适用 于 指针 等 类 型 
typename iterator traits<lter>::distance_type d3 = distance(p,q); /1 正确， 但 丑陋 
Distance_type<lter> d4 = distance(p,q); /1 正确， 更 好 一 些 
auto d5 = distance(p,q); // 正确， 如 果 你 不 需要 显 式 使 用 类 型 的 话 
1 

} 

建议 使 用 后 两 种 方案 。 


模板 iterator 将 迭代 器 的 关键 属性 简单 捆绑 为 一 个 struct， 这 对 迭代 器 的 实现 者 而 言 很 
方便 ， 也 提供 了 一 些 默认 类 型 : 


template<typename Cat, typename T, typename Dist = ptrdiff_t, typename Ptr = Totypename Ref =T&> 
struct iterator { 

using value_type =T; 

using difference_type = Dist ; /1distomce() 所 使 用 的 类 型 

using pointer = Ptr; // 指针 类 型 


委 33 茧 STL 送 代 器 85 


using reference = Ref; /引用 类 型 
using iterator_category = Cat; /类 别 〈 标 签 ) 
}; 


33.1.4” 迄 代 器 操作 
根据 其 类 别 ( 见 33.1.2 节 )， 和 迭代 器 可 能 提供 下 列 全 部 操作 或 其 中 一 部 分 : 


迭代 器 操作 (iso.24.2.2 ) 


++p 前 置 递增 (向 前 移动 一 个 元 素 ): 令 p 指向 下 一 个 元 素 或 尾 元 素 之 后 的 位 置 结果 值 是 递增 后 的 值 
p++ 后 置 递增 (向 前 移动 一 个 元 素 ): 令 p 指向 下 一 个 元 素 或 尾 元 素 之 后 的 位 置 结果 值 是 递增 前 的 值 
*p 访问 ( 解 引用 ): *p 为 p 所 指向 的 元 素 

--p 前 置 递 减 (向 后 移动 一 个 元 素 ): 令 p 指向 前 一 个 元 素 ; 结果 值 是 递减 后 的 值 

p-- 后 置 递减 〈 向 后 移动 一 个 元 素 ): 令 p 指向 前 一 个 元 素 ; 结果 值 是 递减 前 的 值 

p[n] 访问 (下 标 ): p[n] 为 p+n 所 指向 的 元 素 ; 等 价 于 *(p+n) 

p->m 访问 (成 员 访 问 ): 等 价 于 (*p).m 

pS 相等 判定 : p 和 q 指向 相同 元 素 或 都 指向 尾 后 位 置 ? 

pl=q 不 等 判定 : !(p==q) 

p<q p 指向 的 元 素 在 q 指向 的 元 素 之 前 ? 

p<=q p<q || p== 

p>q p 指向 的 元 素 在 q 指向 的 元 素 之 后 ? 

p>=q p>q || p==q 

p+=n 向 前 移动 n 个 位 置 : 令 p 指向 之 后 第 n 个 元 素 

p-=n 向 后 移动 n 个 位 置 : 令 p 指向 之 前 第 n 个 元 素 

q=p+n 令 q 指向 p 之 后 第 nn 个 元 素 

q=p-n 令 q 指向 p 之 前 第 nm 个 元 素 





++p 返回 p 的 引用 ， 而 p++ 必须 返回 一 个 保存 p 的 旧 值 的 副本 。 因 此 ， 对 更 复杂 的 迭代 器 
而 言 ，++p 可 能 比 p++ 更 高 效 。 

下 列 操 作 适 用 于 任何 能 实现 它们 的 迭代 器 ,但 对 随机 访问 迭代 器 ( 见 33.1.2 节 ) 可 能 更 
高 效 : 


迭代 器 操作 (iso.24.4.4 ) 


advance(p,n) 类 似 p+=n; p 至 少 是 一 个 输入 迭代 器 
x=distance(p,q) 类 似 x=q-p; p 至 少 是 一 个 输入 迭代 器 
q=next(p,n) 类 似 q=p+n; p 至 少 是 一 个 前 向 迭代 器 
q=next(p) q=next(p,1) 

q=prev(p,n) 类 似 q=p-n; p 至 少 是 一 个 双向 迭代 器 
q=prev(p) 9q=prev(p,1) 


若 p 不 是 一 个 随机 访问 和 迭代 器 ， 所 有 算法 都 会 花费 n 步 。 


33.2 ” 迁 代 器 适配器 


在 <iterator> 中 ， 标 准 库 提 供 了 适配器 ， 能 从 一 个 给 定 的 迭代 器 类 型 生成 有 用 的 相关 和 迭 
代 器 类 型 : 


迭代 器 适配器 
reverse_iterator 反 向 遍历 33.2.1 节 
back_insert iterator 在 尾部 搬入 33.22 节 
front_insert_iterator 在 头 部 插入 33.2.2 池 
insert_iterator 在 任意 位 置 插入 33.2.2 节 
move_iterator 移动 而 不 是 拷贝 33.2.3 节 
raw_storage_iterator 写 入 未 初始 化 的 存储 空间 34.6.2 节 


iostream 的 欠 代 器 将 在 38.5 节 中 介绍 。 


33.2.1 反 向 迭代 器 


使 用 一 个 迭代 器 我 们 可 以 从 b 到 e 遍历 一 个 序列 [b:e)。 如 果 序 列 允 许 双向 访问 ,我 们 
还 可 以 道 序 ， 即 从 e 到 bb 遍历 序列 。 实 现 逆 序 遍 历 的 迭代 器 称 为 reverse_iterator。 一 个 
reverse_iterator 从 序列 末尾 (由 其 底层 迭代 器 定义 ) 向 序列 起 始 位 置 进行 遍历 。 为 了 获得 
一 个 半 开 区 间 ， 我 们 必须 将 b-1 视 为 序列 的 尾 后 位 置 ， 将 e-1 视 为 起 始 位 置 ， 从 而 得 到 半 
开 区 间 [e-1:b-1)。 因 此 ， 一 个 反 向 和 迭代 器 与 其 底层 欠 代 器 之 间 的 根本 关系 是 : &*(reverse_ 
iterator(p))==&*(p-1)。 特 别 是 ， 如 果 v 是 一 个 vector，v.rbegin() 指 向 其 尾 元 素 v[v. 
size()-1]。 考 虑 下 面 的 序列 : 


begin() end() 
gs r---- 了 了 
图 过 图 过 图 送 LL 


使 用 reverse_iterator， 序 列 会 如 下 所 示 : 





rbegin() rend() 


ES 
加 二 国宝 宇 


reverse_iterator 的 定义 可 能 像 下 面 这 样 : 


template<typename lter> 
class reverse_iterator 
: public iterator<lterator_category<lter>， 
Value_type<lter>, 
Difference_type<iter>, 
Pointer<iter>， 
Reference<iter>>{ 





public: 
using iterator_type = lter; 


reverse_iterator(): current{} {} 
expiicit reverse_iterator(iter p): current{p} {} 
template<typename lter2> 
reverse_iterator(const reverse_iterator<lter2>& p) :current(p.base()) {} 


lter base() const { return current; }》// 当前 迭代 器 值 


reference operator*() const { tmp = current; return *--tmp; } 
pointer operator->() const; 
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reference operator[](difference_type n) const; 


reverse_iterator& operator++() { --currenti return *this; } /注意 : 不 是 ++ 
reverse_iterator operator++(int) { reverse_iterator t = current; -~-current; return t; } 
reverse_iterator& operator--() { ++current; return *this; } ”// 注意 : 不 是 -- 
reverse_iterator operator--(int) { reverse_iterator t = current; ++current; return t; } 


reverse_iterator operator+(difference_type n) const; 
reverse_iterator& operator+=(difference_type n); 
reverse_iterator operator-(difference_type n) const; 
reverse_iterator& operator-=(difference_type n); 

J 


protected: 

iterator current; /1 current 指向 *this 之 后 的 元 素 
private: 

灿 带 

iterator tmp; 儿 用 于 生命 周期 需要 超出 函数 作用 域 的 临时 变量 
}; 


reverse_iterator<lter> 的 成 员 类 型 和 操作 与 lter 一 致 。 特 别 是 ， 如 果 lter 是 一 个 随机 访问 
和 迭代 器 ， 其 reverse_iterator<lter> 支持 中 、+ 和 <。 例如: 
void f(vector<int>& v, list<char>& ist) 
v.rbegin()[3] = 7; // 正确 : 随机 访问 迭代 器 
lst.rbegin()f3] = "4'; 1 错误: 双向 迭代 器 不 支持 中 
*(next(lst.rbegin(),3)) = "4'; 儿 正确 ! 
} 
我 使 用 next() 移动 迭代 器 的 原因 是 list<char>::iterator 这 样 的 双向 迭代 器 不 支持 +( 类 似 [])。 
反 向 迭代 器 允许 我 们 使 用 算法 逆序 访问 序列 。 例 如 ， 为 了 查找 一 个 值 在 序列 中 最 后 出 现 
的 位 置 ， 我 们 可 以 在 逆序 序列 上 使 用 find(): 


auto ri = find(v.rbegin(),v.rend(),val); 咱 最 后 出 现 的 位 置 


注意 ，C::reverse_iterator 与 C::iterator 是 不 同 的 类 型 。 因 此 ， 如 果 我 希望 编写 一 个 使 用 首 
序 序列 的 find_last() 算法 ， 可 能 不 得 不 确定 返回 什么 类 型 的 迭代 唤 : 

template<typename C, typename Val> 

auto find_last(C& c, Val v) -> decitype(c.begin()) 儿 在 接口 中 使 用 C 的 迭代 器 

{ 


auto ri= find(c.rbegin(),c.rend(),v); 
if (ri == c.rend()) return c.end(); 川 用 c.end() 表示 “未 找到 ” 
return prev(ri.base()); 


} 
对 一 个 reverse_iterator，ri.base() 返回 一 个 iterator， 指 向 ri 之 后 的 位 置 。 因 此 ， 为 了 获得 
一 个 迭代 器 ， 与 反 向 迭代 器 ri 指向 相同 的 元 素 ， 我 必须 返回 ri.base()-1。 但 是 ,我 的 容器 
可 能 是 一 个 list， 其 迭代 器 并 不 支持 -， 因 此 我 用 prev() 取而代之 。 

反 向 迭代 器 就 是 普通 迭代 器 ， 因 此 我 可 以 显 式 编写 循环 : 


template<typename C, Val v> 
auto find_last(C& c, Val v) -> decltype(c.begin()) 
{ 
for (auto p = c.rbegin(); p!=c.rend(); ++p) // 逆序 访问 序列 
if (*p==Vv) return --p.base(); 
return c.end(); /| 用 c.end() 表示 “未 找到 ” 
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下 面 的 代码 是 等 价 的 ， 它 使 用 一 个 〈 前 向 ) 和 欠 代 器 反 向 搜索 : 


template<typename C> 
auto find_last(C& c, Val v) -> decltype(c.begin()) 


{ 
for (auto p = c.end(); p!=c.begin(); ) /让 从 序列 尾 反 向 搜索 
if (*—-p==Vv) return p; 
return c.end(); 咱 用 c.end() 表示 “未 找到 ” 
} 


类 似 较 早 的 find_last() 版 本 ,这 个 版 本 要 求 迭代 器 至 少 是 双向 的 。 
33.2.2 ”插入 迭代 器 


通过 一 个 迭代 器 生成 输出 写 人 一 个 容器 意味 着 迭代 器 所 指向 的 元 素 以 及 之 后 的 元 素 都 是 
可 被 覆盖 的 。 这 暗示 有 可 能 溢出 从 而 导致 内 存 崩 演 。 例 如 : 
void f(vector<int>& vi) 


fill_n(vi.begin(),200,7); 1 将 7 赋予 vi[0]..[199] 
} 


如 果 vi 的 元 素数 不 足 200， 我 们 就 有 麻烦 了 。 

在 <iterator> 中 ， 标 准 库 提 出 了 一 种 解决 方案 一 一 插入 器 (inserter) : 当 写 数据 时 ， 播 
人 器 将 新 元 素 插 和 人 序列 而 不 是 覆盖 已 有 元 素 。 例 如 : 

void g(vector<int>& vi) 

fill_n(back_inserter(vi),200,7); 儿 将 200 个 7 添加 到 vi 末尾 

} 
当 通 过 搬入 和 迭代 器 写 元 素 时 ， 和 迭代 器 插 人 新 值 而 不 是 覆盖 所 指向 的 元 素 。 因 此 ， 每 通过 
插 和 人 和 迭代 器 写 人 一 个 值 ， 容 器 的 大 小 就 增加 一 个 元 素 。 插 和 人 器 很 有 用 ， 也 同样 简单 和 
高 效 : 

标准 库 提 供 了 3 种 搬入 迭代 器 : 

e insert iterator 用 insert() 在 指向 的 元 素 之 前 插入 新 值 。 

e front_insert_iterator 用 push_front() 在 序列 首 元 素 之 前 插入 新 值 。 

e@ back _insert iterator 用 push_back() 在 序列 尾 元 素 之 后 插入 新 值 。 
我 们 通常 通过 调用 辅助 函数 来 构造 插入 器 : 


插入 器 构造 函数 (iso.24.5.2 ) 


ii=inserter(c,p) 让 是 一 个 insert_iterator， 指 向 容器 c 中 的 p 
ii=back_inserter(c) ii 是 一 个 back_insert_iterator， 指 向 容器 c 中 的 back() 
ii 是 一 个 front_insert_iterator， 指 向 容器 c 中 的 front() 







ii=front_inserter(c) 





传递 给 inserter() 的 迭代 器 必须 是 容器 中 的 迭代 器 。 对 一 个 顺序 容器 ， 这 意味 着 此 迭代 器 必 
须 是 一 个 双向 和 迭代 器 (从 而 可 以 在 迭代 器 之 前 插入 新 值 )。 例 如 ， 你 不 能 用 inserter() 创建 一 
个 用 于 forward_list 的 插入 器 。 对 一 个 关联 容器 ， 和 迭代 器 只 是 用 来 提示 在 哪里 进行 插入 ， 这 
时 前 向 迭代 器 (如 unordered_set 提供 的 迭代 器 ) 就 是 可 接受 的 了 。 

一 个 插入 器 是 一 个 输出 迭代 器 : 
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insert_iterator<C> 操作 (iso.24.5.2 ) 


insert_iterator p {c,q}; 为 容器 c 构造 一 个 插入 器 ， 指 向 *q; q 必须 指向 c 
insert_iterator p {q}; 拷贝 构造 函数 : p 是 q 的 一 个 拷贝 

p=q 拷贝 赋值 运算 符 ; p 是 q 的 一 个 拷贝 

p=move(q) 移动 赋值 操作 : p 指向 q 所 指向 的 内 容 

++p 令 p 指向 下 一 个 元 素 ; 表达 式 的 值 是 p 的 新 值 
p++ 令 p 指向 下 一 个 元 素 ; 表达 式 的 值 是 p 的 旧 值 
*p=X 在 p 之 前 插入 x 

*p++=X 在 p 之 前 插入 x， 然 后 递增 p 


front_insert_iterator 和 back_insert_iterator 与 普通 插 人 器 的 不 同 之 处 在 于 它们 的 构造 函数 
不 要 求 一 个 迭代 器 。 例 如 : 


vector<string> v; 
back_insert_iterator<v> p; 


不 能 通过 插入 絮 读 取 数 据 。 
33.2.3 ”移动 迭代 器 

通过 移动 迭代 器 读 取 元 素 时 会 移动 元 素 而 非 找 贝 元 素 。 我 们 通常 利用 辅助 函数 从 男 一 个 
迭代 器 来 构造 一 个 移动 迭代 器 : 


移动 和 迭代 器 构造 函数 
mp=make_move_iterator(p) mp 是 一 个 move _iterator， 指 向 p 所 指向 的 元 素 ; p 必须 是 一 个 输入 迭代 器 








一 个 移动 迭代 器 与 构造 它 的 那个 迭代 器 具有 相同 的 操作 。 例 如 ， 若 移动 欠 代 器 p 是 从 一 个 双 
向 迭代 器 构造 的 ， 我 们 就 可 以 执行 --p。 一 个 移动 迭代 器 的 operator*() 简单 返回 所 指向 元 素 
的 右 值 ( 见 7.7.2 节 ): std::move(q)。 例 如 : 


vector<string> read_strings(istream&); 
auto vs = read_strings(cin); /获得 一 些 字符 串 


vector<string> vs2; 
copy(vs,back_inserter(vs2)); 川 从 vs 向 vs2 拷贝 字 符 囊 


vector<string> vs3; 
copy(vs2,make_move_iterator(back_inserter(vs3))); 。 // 从 vs2 向 vs3 移动 字符 串 


这 里 假设 std::copy() 的 容器 版 本 已 经 定义 。 
33.3 ”范围 访问 函数 
在 <iterator> 中 ， 标 准 库 为 容器 提供 了 非 成 员 版 本 的 begin() 和 end() 函数 。 
begin() 和 end() (iso.24.6.5 ) 
p=begin(c) p 是 指向 c 的 首 元 素 的 迭代 器 ; c 是 一 个 内 置 数 组 或 具有 c.begin() 
p=end(c) p 是 指向 c 的 尾 后 位 置 的 迭代 器 ; c 是 一 个 内 置 数组 或 具有 c.end() 


这 些 函 数 非常 简单 : 
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template<typename C> 

auto begin(C& c) -> decltype(c.begin()); 
template<typename C> 

auto begin(const C& c) -> decltype(c.begin()); 
template<typename C> 

auto end(C& c) -> decitype(c.end()); 
template<typename C> 

auto end(const C& c) -> decltype(c.end()); 


template<typename T size_t N> 咱 用 于 内 置 数组 
auto begin(T (&array){N]) -> T*; 

template<typename T, size_t N> 
auto end(T (&array)[N]) -> T:*; 


这 些 函 数 用 于 范围 for 语句 ( 见 9.5.1 节 )， 当 然 ， 用 户 也 能 直接 使 用 它们 。 例 如 : 


template<typename Cont> 
void print(Cont& c) 


for(auto p=begin(c); p1=end(c); ++p) 
cout << *p << \n'; 
} 
void f() 
{ 
vector<int> v {1,2,3,4,5); 
print(v); 
int afl] {1,2,3,4,5}; 
print(a); 
} 


假如 我 在 print() 中 用 的 是 c.begin() 和 c.end()， 则 print(a) 调用 会 失败 。 

只 要 通过 #include 包含 了 <iterator>， 具 有 begin() 和 end() 成 员 的 用 户 自 定义 容器 就 
会 自动 获得 非 成 员 版 本 。 为 了 给 没有 begin() 和 end() 成 员 的 容器 My_container 提供 非 成 
员 的 begin() 和 end()， 我 必须 这 样 编写 代码 : 

template<typename T> 


lterator<My_container<T>> begin(My_container<T>& c) 


return lterator<My_container<T>>{&c[0]}; /指向 首 元 素 的 迭代 器 
} 


template<typename T> 
iterator<My_container<T>> end(My_container<T>& c) 


{ 
} 


在 本 例 中 ,我 假定 一 种 创建 指向 tMy_container 首 元 素 的 迭代 器 的 方法 是 传递 首 元 素 的 地 
址 ， 且 My_container 具有 size()。 


33.4 函数 对 象 
很 多 标准 库 算 法 接受 函数 对 象 (或 函数 ) 参数 ， 来 控制 其 工作 方式 。 常 见 的 函数 对 象 包 
括 比 较 标 准 、 谓 词 (返回 bool 的 函数 ) 和 算术 运算 。 在 <functional> 中 ， 标 准 库 提供 了 若 


return lterator<My_container<T>>{&c[0]+c.size()}; /指向 尾 后 位 置 的 迭代 器 
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谓词 (iso.20.8.5，iso.20.8.6，iso.20.8.7 ) 








p=equal_to<T>(x,y) 当 x 和 yy 类 型 为 TT 时 ，p(x,y) 表示 x==y 
p=not_equal_to<T>(x,y) 当 x 和 yy 类 型 为 T 时 ，p(x,y) 表示 xl=y 
p=greater<T>(x,y) 当 x 和 y 类 型 为 T 时 ，p(x,y) 表示 x>y 
p=less<T>(x,y) 当 x 和 Yy 类 型 为 TT 时，p(x,y) 表示 x<y 
p=greater_equal<T>(x,y) 当 x 和 yy 类 型 为 T 时 ，p(x,y) 表示 x>=y 
p=less_equal<T>(x,y) 当 x 和 y 类 型 为 T 时 ，p(x,y) 表示 x<=y 
p=logical_and<T>(x,y) 当 x 和 y 类 型 为 T 时 ，p(x,y) 表示 x&&y 
p=logical_or<T>(x,y) 当 x 和 y 类 型 为 T 时 ，p(x,y) 表示 xlly 
p=logical_not<T>(x) 当 x 类 型 为 T 时 ，p(x) 表示 !x 
p=bit_and<T>(x,y) 当 x 和 y 类 型 为 T 时 ，p(x,y) 表示 x&y 
p=bit_or<T>(x,y) 当 x 和 yy 类 型 为 T 时 ，p(x,y) 表示 xy 
p=bit_xor<T>(x,y) 当 x 和 yy 类 型 为 下 时 ，p(x,y) 表示 x^y 


例如 : 


vector<int> v; 
/1 
sort(v.begin(),v.end(),greater<int>{}); 1 将 v 排序 为 降序 


这 些 谓 词 大 致 等 价 于 简单 lambda。 例 如 : 


Vector<int> v; 
/1 
sort(v.begin(),v.end(),[](int a, int b) { return a>b; }); 儿 将 v 排序 为 降序 


注意 ，logical_and 和 logical_or 总 是 对 两 个 实 参 都 求 值 (&& 和 || 则 不 是 )。 





算术 运算 (iso.20.8.4 ) 


f=plus<T>(x,y) 当 x 和 y 类 型 为 T 时 ，f(x,y) 表示 x+y 
f=minus<T>(x,y) 当 x 和 yy 类 型 为 T 时 ,f(x,y) 表示 x-y 
f=multiplies<T>(x,y) 当 x 和 y 类 型 为 T 时 ， f(x,y) 表示 x*y 
f=divides<T>(x,y) 当 x 和 y 类 型 为 TT 时 ,f(x,y) 表示 x/y 
f=modulus<T>(x,y) 当 x 和 yy 类 型 为 T 时 ,f(x,y) 表示 x%y 
f=negate<T>(x) 当 x 类 型 为 时 ，f(x) 表示 -x 


33.5 ”函数 适配器 
函数 适配器 接受 一 个 函数 参数 ， 返 回 一 个 可 用 来 调用 该 函数 的 函数 对 象 。 


适配器 (iso.20.8.9，iso.20.8.10，iso.20.8.8 ) 


g=bind(f,args) g(args2) 等 价 于 f(args3)，args3 是 通过 用 args2 中 的 实 参 替换 args 中 对 应 的 占 位 符 
(如 _1、_2 和 _3) 得 到 的 

g=mem_fn(f) 车 p 是 一 个 指针 ， 则 g(p,args) 表示 p->f(args)， 否 则 g(p,args) 表示 p.mf(args) ; args 
是 一 个 (可 能 为 空 的 ) 实 参 列表 

g=not1(f) g(x) 表示 !f(x) 

g=not2(f) g(x,y) 表示 !f(x,y) 


适配器 bind() 和 mem_fn() 进行 实 参 绑 定 ， 也 称 为 柯 里 化 (Currying) 或 部 分 求 值 (partial 
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evaluation) 。 这 些 绑 定 器 和 那些 已 被 弃 用 的 前 身 (如 bind1st()、mem fun() 和 mem_ 
fun_ref()) 在 过 去 曾 被 广泛 使 用 ， 但 大 多 数 应 用 看 起 来 可 以 用 1lambda 很 容易 地 表达 ( 见 
11.4 节 )。 


33.5.1 bind() 


给 定 一 个 函数 和 一 组 实 参 ，bind() 生成 一 个 可 用 该 函数 “剩余 ” 实 参 (如 果 存 在 的 话 ) 
调用 的 函数 对 象 。 例 如 : 


double cube(double); 


auto cube2 = bind(cube,2); 


调用 cube2() 会 用 实 参 2 调用 cube， 即 cube(2)。 我 们 不 必 绑 定 所 有 函数 实 参 。 例 如 : 


using namespace placeholders; 


void f(int,const string&); 


auto g = bind(f,2，1); /将 f0 的 第 一 个 实 参 绑 定 到 2 
f(2,"hello"); 
g("hello"); /等 价 于 调用 f(2,"hello") 


绑 定 器 奇怪 的 实 参 _1 是 一 个 占 位 符 ， 它 告知 bind() 实 参 在 结果 函数 对 象 中 应 放 在 什么 位 
置 。 在 本 例 中 ，g() 的 (第 一 个 ) 实 参 被 用 作 f() 的 第 二 个 实 参 。 

占 位 符 定义 在 命名 空间 std::placeholders 中 ， 该 命名 空间 是 头 文件 <functional> 的 一 
部 分 。 占 位 符 机 制 非常 灵活 ， 考 虑 下 面 的 代码 : 


f(2,"hello™); 

bind(f)(2,"hello"); 儿 也 是 调用 f(2,"hello"); 
bind(f，1，2)(2, "hello "); /也 是 调用 f(2,"hello"); 
bind(f，2，1)("hello",2); 儿 实 参 逆 序 : 也 是 调用 ff2,"hello"); 


auto g = 中 (const string& s, int i) { f(i,s); } // 实 参 逆序 
g("hello",2); 1 也 是 调用 f(2,"hello"); 


为 了 绑 定 重 载 函数 的 参数 ， 我 们 必须 显 式 说 明 绑 定 哪 个 版 本 的 函数 : 


int pow(int,int); 
double pow(double,double); /pow0O 被 重 载 





auto pow2 = bind(pow, 1,2); 儿 错误: 绑 定 哪 个 pow0O?2 
auto pow2 = bind((double(*)(double,double))pow，1,2); // 正确 (但 丑陋 ) 


注意 ，bind() 接受 普通 表达 式 作 为 参数 。 这 意味 着 对 引用 参数 而 言 ， 在 bind() 看 到 它们 之 前 
已 被 解 引用 。 例 如 : 


void incr(int& i) 


{ 
++i; 
} 
void user() 
{ 
int i= 1; 
iner(i); /ii 变 为 2 
auto inc = bind(incr,_1); 
inc(i); /Ji 仍 为 2; inc(i) 递增 的 是 i 的 局 部 拷贝 


为 了 解决 这 个 问题 ， 标 准 库 提供 了 一 对 适配器 : 
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reference_wrapper<T> (iso.20.8.3 ) 
r=ref(t) r 是 T&t 的 一 个 reference_wrapper; 不 抛 出 异常 
r=cref(t) r 是 const T& t 的 一 个 reference_wrapper; 不 抛 出 异常 


这 样 即 可 解决 bind() 的 “引用 问题 ”: 


void user() 
{ 
inti=1; 
incr(i); Mi 变 为 2 
auto inc = bind(incr,_1); 
inc(ref(i)); Ji 变 为 3 
} 


ref() 也 被 用 于 向 thread 传递 引用 实 参 ， 因 为 thread 的 构造 函数 是 可 变 参数 模板 ( 见 42.2.2 节 )。 

到 目前 为 止 ， 我 要 么 立即 使 用 bind() 的 结果 ， 要 么 将 其 赋予 用 auto 声明 的 变量 。 这 人 免 
去 了 我 们 说 明 bind() 调用 返回 类 型 的 麻烦 。 这 种 方式 很 有 用， 因为 bind() 的 返回 类 型 会 随 
着 被 调用 的 函数 类 型 及 保存 的 实 参 值 而 变化 。 特 别 是 ， 如 果 返 回 的 函数 对 象 必 须 保 存 绑 定 的 
参数 值 ， 它 就 会 非常 大 。 但 是 ， 我 们 有 时 和 希望 指明 要 求 的 实 参 类 型 和 返回 结果 类 型 。 为 此 ， 
我 们 可 以 对 一 个 function ( 见 33.5.3 节 ) 说 明 这 些 内 容 。 


33.5.2 mem _fn() 
函数 适配器 mem_fn(mf) 生成 一 个 函数 对 象 ， 可 以 作为 非 成 员 函 数 调 用 。 例 如 : 


void user(Shape:* p) 


t 
p->draw(); 
auto draw = mem_fn(&Shape::draw); 
draw(p); 

} 


mem_fn() 的 主要 用 途 是 服务 于 需要 非 成 员 函 数 的 算法 。 例 如 : 


void draw _all(vector<Shape*>& v) 


for_each(v.begin(),v.end(),mem_fn(&Shape::draw)); 


因此 ，mem_fn() 可 被 看 作 从 面向 对 象 调用 风格 到 函数 式 调用 风格 的 一 种 映射 。 
通常 ，lambda 是 比 绑 定 器 更 简单 也 更 通用 的 替代 方案 。 例 如 : 


void draw_all(vector<Shape*>& v) 


{ 
for_each(v.begin(),v.end(),[](Shape:* p){p->draw(); }); 


} 


33.5.3 function 


我 们 可 以 直接 使 用 bind()， 以 及 用 它 来 初始 化 auto 变量 。 从 这 个 角度 看 ，bind() 很 像 
是 一 个 lambda。 

如 果 要 将 bind() 的 结果 赋予 一 个 特定 类 型 的 变量 ， 可 以 使 用 标准 库 类 型 function。 我 们 
通过 指明 返回 类 型 和 参数 类 型 来 说 明 一 个 function。 
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function<R(Argtypes...)> (iso.20.8.11.2 ) 


function f {}; 
function f {nullptr}; 
function f {9g}; 


function f {allocator_arg_t,a}; 

function f {allocator_arg_t,a,nullptr_t}; 
function f {allocator_arg_t,a,g}; 

f2=f 

f=nullptr 

f.swap(f2) 


fassign(f2,a) 
bool b {f}; 


r=f(args) 
ti=f.target_type() 


p=f.target<F>() 


f==nullptr 
nullptr== 
fl=nullptr 
nullptr!=f 
swap(f,f2) 


例如 : 


int f(double); 
function<int(double)> fct {f}; 
int g(int); 


void user() 


fct = [I(double d) { return round(d); }; 


fct = fi; 
fct = g; 
} 


f 是 一 个 空 function; 不 抛 出 异常 

f 是 一 个 空 function; 不 抛 出 异常 

f 是 一 个 function， 保存 着 g ; g 可 以 是 能 用 f 的 参数 类 型 调用 的 
任何 东西 

f 是 一 个 空 function; 使 用 分 配器 a; 不 抛 出 异常 

f 是 一 个 空 function; 使 用 分 配器 a; 不 抛 出 异常 

f 是 一 个 function， 保 存 着 g; 使 用 分 配器 a; 不 抛 出 异常 

f2 是 f 的 一 个 拷贝 

f 变 为 空 

交换 f 和 人 2 的 内 容 ; f 和 f2 必须 是 相同 的 function 类 型 ; 不 抛 出 
异常 

f 获 得 f2 的 一 个 拷贝 和 分 配器 a 

将 f 转 换 为 bool ; 若 f 非 空 ，b 为 true ; 显 式 构造 函数 ; 不 抛 出 
异常 

用 args 调用 保存 在 f 中 的 函数 ; 实 参 类 型 必须 匹配 ff 的 参数 类 型 

ti 为 f 的 type_info; 若 f 不 包含 可 调用 对 象 ， 则 ti==typeid(void); 
不 抛 出 异常 

若 ftarget_type()==typeid(F)， 则 p 指向 保存 的 可 调用 对 象 ， 否 
则 p==nullptr; 不 抛 出 异常 

f 为 空 ? 不 抛 出 异常 

f==nullptr 

!(f==nullptr) 

!(f==nullptr) 

fswap(f2) 


儿 初 始 化 为 全 


儿 将 lambda 赋予 fct 
儿 将 function 赋予 fct 
/| 错误 : 不 正确 的 参数 类 型 


在 极 少数 情况 下 ， 程 序 员 需要 检查 一 个 function 而 不 是 像 通常 那样 简单 调用 它 ， 
使 用 获取 目标 函数 的 操作 。 

标准 库 function 是 一 种 类 型 ， 它 可 以 保存 你 能 用 调用 运算 符 () ( 见 2.2.1 节 、3.4.3 节 、 
11.4 节 和 19.2.2 节 ) 调用 的 任何 对 象 。 即 ， 一 个 function 类 型 对 象 就 是 一 个 函数 对 象 。 例 如 : 
外 常规 的 四 舍 五 入 


此 时 就 可 以 


int round(double x) { return static_cast<double>(floor(x+0.5)); } 


function<int(double)> fi /1/f 可 以 保存 可 用 一 个 double 调用 并 返回 一 个 int 的 任何 东西 





enum class Round_style { truncate, round }; 


struct Round { 咱 函 数 对 象 携带 着 状态 
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Round _styie s; 
Round(Round_ style ss) :s(ss) {} 
int operator()(double x) const { return (s==Round_style::round) ? (x+0.5) : x; }; 


上 

void +1() 

{ 
f= round; 
cout << f(7.6) << "\n'; /通过 f 调 用 函数 round 
f= Round(Round_style::truncate); 
cout << f(7.6) << \n'; 咱 调用 函数 对 象 
Round_style style = Round_ style::round; 
f= [style] (double x){ return (style==Round_style::round) ? x+0.5 : xi }; 
cout << f(7.6) << \n'; /省 调用 lambda 
vector<double> v{7.6}; 
f= Round(Round_ style::round); 
std::transform(v.begin(),v.end(),v.begin(),f); 儿 传 递 给 algorithm 
cout << v[0] << "\n'; 咱 由 lambda 转换 

} 


我 们 会 得 到 8、8、7 和 8。 





显然 ，function 对 回调 、 将 操作 作为 参数 传递 等 机 制 非常 有 用 。 
33.6 建议 
[1] 一 个 输入 序列 由 一 对 迭代 器 定义 ; 33.1.1 节 。 
[2 ] 一 个 输出 序列 由 单一 迭代 器 定义 ; 程序 员 应 负责 避免 溢出 ; 33.1.1 节 。 
[3 ] 对 任意 迭代 器 p，[p:p) 是 一 个 空 序列 ; 33.1.1 节 。 
[4] 使 用 序列 尾 表示 “ 未 找到 ”; 33.1.1 节 。 
[5 ] 将 迭代 器 理解 为 更 通用 、 通 常 行为 也 更 良好 的 指针 ; 33.1.1 节 。 
[6] 使 用 迭代 器 类 型 ， 如 list<char>::iterator， 而 不 是 指向 容器 中 元 素 的 指针 ; 33.1.1 节 。 
[7] 用 iterator_traits 获取 迭代 器 的 相关 信息 ; 33.1.3 节 。 
[8] 可 以 用 iterator traits 实现 编译 时 分 发 ; 33.1.3 节 。 
[9] 用 iterator_ traits 实现 基于 迭代 器 类 别 选 择 最 优 算法 ; 33.1.3 节 。 
[ 10 ] iterator traits 属实 现 细节 ; 对 它们 的 使 用 优选 隐 式 方式 ; 33.1.3 节 。 
[11] 用 base() 从 reverse_iterator 提取 iterator; 33.2.1 节 。 
[12 ] 可 以 使 用 插入 迭代 器 向 容器 添加 新 元 素 ; 33.2.2 节 。 
[13 ]】 move _iterator 可 用 来 将 拷贝 操作 变 为 移动 操作 ; 33.2.3 节 。 
[14] 确认 你 的 容器 可 用 范围 for 语句 遍历 ; 33.3 节 。 
[15] 用 bind() 创建 函数 和 函数 对 象 的 变 体 ; 33.5.1 节 。 
[16] 注意 bind() 会 提前 解 引用 ; 如 果 你 希望 推迟 解 引用 ， 使 用 ref(); 33.5.1 节 。 
[17] 可 使 用 mem_fn() 或 lambda 将 p->f(a) 调用 规范 转换 为 fp,a); 33.5.2 节 。 
[18] 如 果 你 需要 一 个 可 以 保存 各 种 可 调用 对 象 的 变量 ， 使 用 function; 33.5.3 节 。 
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内 存 和 资源 


任何 人 都 可 以 有 想法 ; 如 何 按 想 法 做 才 是 最 重要 的 。 


e 引言 
e。“ 拟 容器 ” 

array; bitset; vector<bool>; 元 组 
e 资源 管理 指针 

unique_ptr; shared_ptr; weak_ptr 
e 分 配器 

默认 分 配器 ; 分 配器 禁 取 ; 指针 茜 取 ; 限 域 的 分 配器 
e 垃圾 收集 接口 
e 未 初始 化 内 存 

临时 缓冲 区 ; raw_storage _iterator 
e 建议 


34.1 引言 
STL (第 31 ~ 33 章 ) 是 标准 库 中 高 度 结构 化 的 、 通 用 的 数据 管理 和 操作 组 件 。 本 章 介 


绍 更 为 专用 的 以 及 处 理 裸 内 存 的 〈 与 处 理 强 类 型 对 象 相对 ) 组 件 。 


34.2 “ 拟 容器 ” 


一 一 特 里 . 普 拉 切 特 


标准 库 中 有 一 些 容器 不 能 很 好 地 纳入 STL 框架 ( 见 31.4 节 、33.2 节 和 33.1 节 )， 例 如 


内 置 数 组 、array 和 string。 我 有 时 将 它们 称 为 “ 拟 容器 ”( 见 31.4 节 ), 但 这 并 不 是 很 公平 : 
它们 保存 元 素 ， 因 此 就 是 容器 ， 只 不 过 都 有 一 些 限制 或 包含 额外 组 件 ， 因 而 放 在 STL 语 境 
中 显得 有 些 尴 做 。 分 开 介绍 这 些 容器 也 简化 了 STL 的 介绍 : 


RE 


TIN] 固定 大 小 的 内 置 数组 : 连续 存储 的 N 个 类 型 为 T 的 元 素 ; 隐 式 转换 为 T* 

array<TN> 固定 大 小 的 数组 ， 连 续 存 储 的 N 个 类 型 为 T 的 元 素 ; 类 似 内 置 数组 ， 但 解决 了 大 部 分 问题 
bitset<N> 固定 大 小 的 N 个 二 进 制 位 的 序列 

vector<bool> vector 的 特例 化 版 本 ， 紧 凑 保 存 二 进 制 位 序列 

pair<T,U> 两 个 元 素 ， 类 型 为 T 和 U 

tuple<T...> 任意 数目 任意 类 型 的 元 素 的 序列 

basic_string<C> 类 型 为 C 的 字符 的 序列 ; 提供 了 字符 串 操作 

valarray<T> 类 型 为 T 的 数值 的 数组 ; 提供 数值 运算 


为 什么 标准 库 会 提供 这 么 多 容器 呢 ?” 这 是 为 了 满足 很 多 常见 但 又 有 差异 (通常 也 有 重合 ) 的 
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需求 。 如 果 标 准 库 不 提供 这 些 容器 ， 很 多 人 将 不 得 不 自己 实现 。 例 如 : 

e pair 和 tuple 是 异 构 的 ; 所 有 其 他 容器 都 是 同 构 的 (元 素 都 是 相同 类 型 )。 

e array、vector 和 tuple 连续 保存 元 素 ; forward_list 和 map 是 链接 结构 。 

e bitset 和 vector<bool> 保存 二 进 制 位 ， 通 过 代理 对 象 访问 这 些 二 进 制 位 ; 所 有 其 他 

标准 库容 器 都 可 以 保存 不 同类 型 并 直接 访问 元 素 。 

e basic_string 要 求 其 元 素 为 某 种 字符 类 型 ， 它 提供 了 字符 串 操 作 ， 如 连接 操作 和 区 域 

敏感 操作 ( 见 第 39 章 )，valarray 要 求 其 元 素 为 数值 类 型 ， 并 提供 数值 运算 。 

所 有 这 些 容器 都 可 视 为 提供 了 大 规模 程序 员 社 区 所 需 的 特殊 功能 。 没 有 任何 单一 容器 能 
满足 所 有 需求 ， 因 为 有 些 需 求 是 冲突 的 ， 例 如 ,“ 增 长 的 能 力 ” 与 “保证 在 固定 位 置 分 配 ”， 
以 及 “添加 元 素 不 会 导致 其 他 元 素 移动 ”与 “空间 连续 分 配 ” 。 此 外 ， 非 常 通用 的 容器 可 能 
意味 着 不 可 接受 的 额外 开销 。 


34.2.1 array 


array 定义 在 <array> 中 ， 是 固定 大 小 的 给 定 类 型 的 元 素 的 序列 ， 元 素数 目 在 编译 时 指 
定 。 因 此 ，array 连同 其 元 素 可 以 在 栈 中 、 对 象 内 或 静态 存储 中 分 配 空间 。array 在 哪个 作用 
域 中 定义 ,元素 就 会 在 其 中 分 配 。 理 解 array 的 最 好 方式 是 将 其 视 为 固定 大 小 的 内 置 数 组 ， 
但 不 会 隐 式 地 、 出 乎 意料 地 转换 为 指针 类 型 ， 且 提供 了 一 些 便利 的 函数 。 与 内 置 数 组 相 比 ， 
使 用 array 不 会 带 来 (时 间或 空间 上 的 ) 额外 开销 。array 不 遵循 STL 的 “元 素 句柄 ”容器 
模型 ， 而 是 直接 包含 其 元 素 : 

template<typename T, size_t N> WN 个 的 数组 ( 见 iso.23.3.2) 


struct array { 


站 
类 似 vector 的 类 型 和 操作 ( 见 31.4 节 )， 
改变 容器 大 小 的 操作 、 构 造 函 数 和 assign() 函数 除外 


void fill(const T& v);// 复制 v 的 N 个 拷贝 
void swap(array&) noexcept(noexcept(swap(declval<T&>(), declval<T&>()))); 


T_elem[N]; /实现 细节 
}; 
array 中 不 保存 任何 “管理 信息 ”( 如 大 小 )。 这 意味 着 移动 ( 见 17.5 节 ) 一 个 array 比 拷贝 它 
更 为 高 效 (除非 array 的 元 素 是 资源 句柄 ， 且 定义 了 高 效 的 移动 操作 )。array 没有 构造 函数 
或 分 配器 〈 因 为 它 不 直接 分 配 任何 东西 )。 
array 的 元 素数 目 和 下 标 值 是 unsigned 类 型 (size_t)， 这 与 vector 类 似 ， 但 与 内 置 数 
组 不 同 。 因 此 ， 一 个 朴 忽 的 编译 器 可 能 会 接受 array<int,-1>， 而 我 们 希望 编译 器 能 对 此 给 
出 一 个 警告 。 
我 们 可 以 用 初始 化 器 列表 来 初始 化 一 个 array: 
array<int,3> a1 = {1, 2, 3 }; 
初始 化 器 列表 中 的 元 素数 目 必须 小 于 等 于 array 指定 的 元 素数 。 照 例 ， 如 果 初 始 化 器 列表 只 
为 部 分 而 不 是 全 部 元 素 提 供 了 值 ， 剩 余 的 元 素 用 相应 的 默认 值 进行 初始 化 。 例 如 : 
void f() 
array<string, 4> aa = {"Churchill"，"Clare"}; 


1/ 
} 
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最 后 两 个 元 素 会 被 初始 化 为 空 字 符 串 。 
我 们 必须 指定 元 素数 目 : 
array<int> ax = { 1, 2, 3 };// 错误 : 未 指定 大 小 

为 了 避免 自己 定义 特殊 情况 的 麻烦 ， 元 素数 目 可 以 为 零 : 
int<int,0> a0; 


元 素数 目 必 须 是 一 个 常量 表达 式 : 
void f(int n) 
{ 


array<string,n> aa = {"John's", "Queens' "}; 儿 错误 : 大 小 不 是 常量 表达 式 
ll 


} 
如 果 你 需要 可 变 元 素数 目 ， 应 使 用 vector。 另 一 方面 ， 由 于 array 的 元 素数 目 在 编译 时 即 
知 ，array 人 size() 是 一 个 constexpr 函数 。 
array 没有 拷贝 实 参 值 的 构造 函数 (vector 有 这 样 的 构造 函数 ; 见 31.3.2 节 )， 而 是 提供 
了 一 个 fl() 操作 : 
void f() 
{ 
array<int,8> aa; 咱 到 这 里 为 止 还 未 初始 化 
aa.fill(99); /赋值 8 个 99 
人 
} 
由 于 array 不 遵循 “元 素 句 柄 ”模型 ， 因 此 swap() 必须 真 的 交换 元 素 ， 这 样 ， 交 换 两 个 
array<T,N> 就 会 对 N 对 本 进行 swap() 操作。array<T,N>::swap() 的 声明 表达 了 : 如 果 TT 
的 swap() 可 能 抛 出 异常 ， 那 么 array<T,N> 的 swap() 也 可 能 抛 出 异常 。 显 然 ， 我 们 应 该 像 
躲避 瘟疫 一 样 避免 抛 出 swap()。 
如 果 需 要 ， 可 以 将 一 个 array 作为 指针 显 式 地 传递 给 一 个 C 风格 的 函数 。 例 如 : 


void flint* p, int sz); // C 风格 的 接口 
void g() 
{ 


array<int,10> a; 


f(a,a.size()); 咱 错 误 : 不 进行 转换 
f(&af0],a.size()); MC 风格 的 用 法 
f(a.data(),a.size()); J1C 风格 的 用 法 


auto p = find(a.begin(),a.end(),777); 外 C+HSTL 风格 的 用 法 
Wh 
} 
vector 是 如 此 灵活 ， 我 们 为 什么 要 使 用 array 呢 ? 原因 是 array 虽 不 如 vector 灵活 ， 但 更 
简单 。 少 数 情况 下 ， 直 接 访问 分 配 在 栈 中 的 元 素 较 之 在 自由 存储 空间 中 分 配 元 素 ， 然 后 通过 
vector (句柄 ) 间接 访问 它们 ， 最 后 将 它们 释放 ， 会 有 巨大 的 性 能 优势 。 当 然 另 一 方面 ， 栈 
是 一 个 有 限 的 资源 (特别 是 在 一 些 艇 人 式 系统 中 )， 而 栈 溢出 是 非常 糟糕 的 。 
如 果 我 们 可 以 使 用 内 置 数组 ， 又 为 什么 要 使 用 array 呢 ? array 了 解 自己 的 大 小 ， 因 此 
很 容易 使 用 标准 库 算法 ， 而 且 可 以 拷贝 (用 = 或 初始 化 ) 。 但 是 ,我 选择 array 的 主要 原因 








是 ， 它 使 我 不 必 为 糟糕 的 指针 转换 头疼 。 考 虑 下 面 的 代码 : 
void h() 
{ 
Circle a1[10]; 
array<Circle,10> a2; 
Wsss 
Shape*p1=a1;  ”// 正 确 : 但 灾难 即将 发 生 
Shape* p2 = a2; ” /|/ 错误: 没有 array<Circle,10> 到 Shape* 的 转换 
p1[3].draw(); 1 灾难 
} 


注释 中 的 “灾难 ”假定 sizeof(Shape)<sizeof(Circle)， 这 样 通 过 一 个 Shape* 对 一 个 
Circle[] 进行 下 标 操作 会 给 出 一 个 错误 的 偏 移 量 ( 见 27.2.1 节 和 17.5.1.4 节 )。 在 这 一 点 上 ， 
所 有 标准 库容 器 都 优 于 内 置 数 组 。 

我 们 可 以 将 array 看 作 一 个 所 有 元 素 都 是 相同 类 型 的 tuple ( 见 34.2.4 节 )。 标 准 库 提供 
了 对 这 一 视角 的 支持 。tuple 的 辅助 类 型 函数 tuple_size 和 tuple_element 可 用 于 array: 


tuple_size<array<T,N>>::value IIN 
tuple_element<S,array<T,N>>::type HT 


我 们 也 可 以 用 函数 get<i> 访问 第 i 个 元 素 : 


template<size_t index, typename T, size_t N> 
T& get(array<T,N>& a) noexcept; 
template<size_t index, typename T, size_t N> 
T&& get(array<T,N>&& a) noexcept; 
template<size_t index, typename T, size_t N> 
const T& get(const array<T,N>& a) noexcept; 


例如 : 
array<int,7> a = {1,2,3,5,8,13,25}; 
auto x1 = get<5>(a); I 13 
auto x2 = af5]; /1 13! 
auto sz = tuple_size<decltype(a)>::value; 117 


typename tuple_element<5,decltype(a)>::type x3 = 13; // x3 是 一 个 int 
编写 需要 tuple 的 代码 时 会 用 到 这 些 类 型 函数 。 

使 用 constexpr 函数 ( 见 28.2.2 节 ) 和 类 型 别名 ( 见 28.2.1 节 ) 可 以 提高 这 段 代码 的 可 
读 性 : 


auto sz = Tuple_size<decitype(a)>(); 1/ 7 


Tuple_element<5,decltype(a)> x3 = 13; //x3 是 一 个 int 


这 种 tuple 语法 就 是 用 于 通用 代码 中 的 。 
34.2.2 bitset 


系统 的 一 些 方面 ， 如 输入 流 的 状态 ( 见 38.4.5.1 节 )， 通常 表示 为 一 组 标志 ， 指 示 二 元 
状态 ， 如 好 / 坏 、 真 / 假 以 及 开 / 关 。 通 过 整数 上 的 位 运算 ( 见 11.1.1 节 )，C++ 提供 了 对 小 
标志 集合 概念 的 高 效 支持 。 类 bitset<N> 推广 了 这 一 概念 ， 并 通过 提供 N 个 二 进 制 位 的 序列 
[0:N) 上 的 操作 实现 了 更 好 的 便利 性 ， 其 中 N 在 编译 时 已 知 。 对 不 能 放 入 一 个 long long int 
中 的 位 集合 ， 使 用 bitset 比 直 接 使 用 整数 方便 得 多 。 对 更 小 的 集合 ，bitset 通常 也 是 最 优 的 。 
如 果 你 希望 命名 这 些 二 进 制 位 ， 而 不 是 简单 编号 ， 可 选 的 替代 方案 包括 set ( 见 31.4.3 节 )、 





枚 举 〈 见 8.4 节 ) 或 位 域 ( 见 8.2.7 节 )。 

一 个 bitset<N> 就 是 一 个 包含 N 个 二 进 制 位 的 数组 ， 它 定义 在 <bitset> 中 。 它 与 vector 
<bool> ( 见 34.2.3 节 ) 的 不 同 之 处 是 大 小 固定 ,与 set ( 见 31.4.3 节 ) 的 不 同 之 处 是 二 进 制 
位 用 整数 索引 而 不 是 关联 值 ， 与 vector<bool> 和 set 的 共同 差异 是 提供 了 操纵 二 进 制 位 的 
操作 。 

用 内 置 指针 ( 见 7.2 节 ) 是 不 可 能 寻 址 一 个 二 进 制 位 的 。 因 此 ，bitset 提供 了 一 种 位 引 
用 (代理) 类 型 。 对 那些 由 于 某 种 原因 不 适合 用 内 置 指针 寻 址 的 对 象 ， 通 常 这 种 技术 是 很 有 
用 的 解决 方案 : 


template<size_t N> 
class bitset { 


public: 
class reference { 11 引 用 单一 二 进 制 位 
friend class bitset; 
reference() noexcept; 
public: /支持 [0:b.size()) 间 从 0 开始 的 下 标 操作 
“reference() noexcept; 
reference& operator=(bool x) noexcept; .1 用 于 bfij=x 赋 值 ; 
reference& operator=(const reference&) noexcept; /| 用 于 bfi]=bD] 赋值 ; 
bool operator () const noexcept; 儿 返 回 “b[ 叫 
operator bool() const noexcept; // 用 于 x=b[ij 转换 ; 
reference& flip() noexcept; lb[i].flipO; 
}; 
1 
}; 


由 于 历史 原因 ，bitset 的 风格 与 其 他 标准 库 类 不 同 。 例 如 ， 如 果 一 个 索引 (也 称 为 位 位 置 ， 
bit position) 超出 范围 ， 会 抛 出 一 个 out_of_range 异常 。bitset 不 提供 迭代 器 。 位 位 置 从 右 
至 左 编号 ， 与 二 进 制 位 在 机 器 字 中 的 顺序 相同 ， 因 此 bli] 的 值 为 pow(2,i)。 这 样 ， 一 个 位 集 
合 可 以 看 作 一 个 N 位 二 进 制 数 : 


人 位置 98876543 2 1 0 
of111|1[ofi 





沁 





























34.2.2.1 构造 函数 
一 个 bitset 可 以 用 指定 个 0 构造， 也 可 以 用 一 个 unsigned long long int 中 的 二 进 制 位 
或 一 个 string 构造 : 


bitset<N> 构造 函数 (iso.20.5.1 ) 


bitset bs {}; N 个 二 进 制 0 

bitset bs {n}; 用 n 中 的 二 进 制 位 初始 化 ; n 是 一 个 unsigned long long int 

bitset bs {s,i,n,z,0}; 用 s 中 区 间 [ii+n) 内 的 n 个 二 进 制 位 初始 化 ; s 是 一 个 basic_string<C,Tr,A> ; z 
是 表示 0 的 字符 ， 类 型 为 C; o 是 表示 1 的 字符 ， 类 型 为 C; 显 式 构造 函数 

bitset bs {Ss,i,n,2}; bitset bs {S,i,n,z,C{ 1)}; 

bitset bs {Ss,i,n}; bitset bs {Ss,i,n,C{0'),C{1')}; 

bitset bs {s,i}; bitset bs {s,i,npos,C{°0'},C{ 1')}; 

bitset bs {s}; bitset bs {s,0,npos,C{'0'},C{'1')}; 

bitset bs {p,n,z,0}; 用 序列 [p:p+n) 间 的 n 个 二 进 制 位 初始 化 ; p 是 一 个 类 型 为 C* 的 C 风格 字符 串 ; 


z 是 表示 0 的 字符 ， 类 型 为 C; o 是 表示 1 的 字符 ， 类 型 为 C; 显 式 构造 函数 
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( 续 ) 
bitset<N> 构造 函数 (iso.20.5.1 ) 
bitset bs {p,n,z}; bitset bs {p,n,z,C{'0')}; 
bitset bs {p,n}; bitset bs {p,n,C{'0'},C{'1"); 
bitset bs {p}; bitset bs {p,npos,C{'0'},C{'1')}; 


npos 位 置 为 string<C> 的 “ 尾 后 位 置 "， 表示 “所 有 字符 直至 末尾 ”的 含义 ( 见 36.3 节 )。 

若 用 户 提供 了 一 个 unsigned long long int 实 参 ， 此 整数 中 的 每 一 位 将 用 来 初始 化 
bitset 中 对 应 的 位 (如 果 有 的 话 )。 对 basic_string ( 见 36.3 节 ) 的 处 理 类 似 ， 差 别 仅 在 
于 二 进 制 位 值 0 用 字符 '0' 表示， 值 1 用 字符 ‘1 表示， 其 他 字符 都 会 导致 抛 出 invalid_ 
argument 异常 。 例 如 : 


void f() 
{ 
bitset<10> b1; //all 0 
bitset<16> b2 = 0xaaaa; 1! 1010101010101010 
bitset<32> b3 = 0xaaaa; 1! 00000000000000001010101010101010 
bitset<10> b4 {"1010101010"}; ll 1010101010 
bitset<10> b5 {"10110111011110",4}; I 0111011110 
bitset<10> b6 {string{"1010101010"}}; 中 1010101010 
bitset<10> b7 {string{"10110111011110"},4}; /0111011110 
bitset<10> b8 {string{"10110111011110"},2,8}; 外 11011101 
bitset<10> b9 {string{"n0g00d")}; 咱 抛 出 invalid_argument 
bitset<10> b10 = string{"101001"); 儿 错误: 没有 string 到 bitset 隐 式 转换 


} 


bitset 设计 中 的 一 个 关键 思想 是 : 能 放 入 单个 机 器 字 中 的 bitset 可 优化 实现 。 其 接口 反映 了 
这 一 思想 。 


34.2.2.2 bitset 操作 
bitset 提供 了 访问 单独 的 二 进 制 位 和 操纵 整体 位 集合 的 运算 符 : 


bitset<N> 操作 (iso.20.5 ) 


bs[i] bs 的 第 i 位 

bs.test(i) bs 的 第 i 位 ; 车 i 不 在 [0:bs.size()) 内 ， 抛 出 out_of_range 
bs&=bs2 位 与 

bs|=bs2 位 或 

bs^=bs2 位 异 或 

bs<<=n 逻辑 左 移 (填充 0 ) 

bs>>=n 逻辑 右 移 (填充 0 ) 

bs.set() 将 bs 的 所 有 位 置 1 

bs.set(i,v) bs[i]=v 

bs.reset() 将 bs 的 所 有 位 置 0 

bs.reset(i) bs[i]=0; 

bs.flip() 对 bs 中 的 每 一 位 做 bs[i]=”bsii] 


bs.flip(i) bs[i]="bs[i] 
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( 续 ) 
bitset<N> 操作 (iso.20.5 ) 
bs2="bs 创建 补 集 : bs2=bs，bs2.flip() 
bs2=bs<<n 创建 左 移 集 : bs2=bs，bs2<<=n 
bs2=bs>>n 创建 右 移 集 : bs2=bs，bs2>>=n 
bs3=bs&bs2 位 与 : 对 集合 bs 中 的 每 一 位 bs3[i]=bs[i]&bs2[i] 
bs3=bs|bs2 位 或 : 对 集合 bs 中 的 每 一 位 bs3[i]=bs[i]|bs2[i] 
bs3=bs^bs2 位 异 或 : 对 集合 bs 中 的 每 一 位 bs3[i]=bs[i]^bs2[i] 
is>>bs 从 is 中 读 取 数据 存 人 bs; is 是 一 个 istream 
os<<bs 将 bs 写 和 人 os; os 是 一 个 ostream 





当 >> 和 << 的 第 一 个 运算 对 象 是 一 个 iostream 时 ， 它 们 表示 IO 运算 符 ， 否 则 表示 移 位 运 
算 符 且 第 二 个 运算 对 象 必须 是 一 个 整数 。 例 如 : 


bitset<9> bs ("110001111"); 


cout << bs << "\n'; /将 "110001111" 写 到 cout 

auto bs2 = bs<<3; lI bs2 == "001111000"; 

cout << bs2 << "\n'; 儿 将 "001111000" 写 到 cout 

cin >> bs; 咱 从 cin 读 取 数 据 

bs2 = bs>>3; 儿 若 输入 为 "110001111"， 则 bs2 == "000110001" 
cout << bs2 << "\n'; 咱 将 "000110001" 写 到 cout 


bitset 的 移 位 操作 采用 逻辑 移 位 (而 非 循 环 移 位 )。 这 意味 着 一 些 位 会 “移出 末尾 ”"， 相 应 的 
一 些 位 被 置 为 默认 值 0。 注 意 ， 由 于 size_t 是 一 种 无 符号 类 型 ， 因 此 移 位 距离 不 可 能 是 负 
数 。 但 这 意味 着 b<<=-1 其 实 表示 移 位 距离 是 一 个 非常 大 的 正 数 ， 因 此 使 得 bitset b 的 所 有 
位 都 被 置 为 0。 你 的 编译 器 应 该 对 此 给 出 警告 。 

bitset 还 支持 size()、==、1/O 等 常用 操作 : 


更 多 bitset<N> 操作 (iso.20.5 ) 
对 basic_string<C,TrA>，C、Tr 和 A 都 有 默认 值 








n=bs.to_ulong!() n 是 bs 对 应 的 unsigned long 值 
n=bs.to_ullong() n 是 bs 对 应 的 unsigned long long 值 
s=bs.to_string<C, Tr,A>(c0,c1) s[i]=(b[il])?c1:c0; s 是 一 个 basic_string<C,Tr,A> 
s=bs.to_string<C, Tr,A>(c0) s=bs.template to_string<C, Tr,A>(c0,C{'1'}) 
s=bs.to_string<C, Tr,A>() s=bs.template to_string<C, Tr,A>(C{'0’},C{'1'}) 
n=bs.count() n 是 bs 中 1 的 个 数 

n=bs.size() n 是 bs 中 二 进 制 的 位 数 

bs==bs2 bs 和 bs2 值 相 等 ? 

bs!=bs2 !(bs==bs2) 

bs.all() bs 为 全 13? 

bs.any() bs 中 有 17? 

bs.none() bs 中 没有 1? 

hash<bitset<N>> hash 针对 bitset<N> 的 特例 化 版 本 


操作 to_ullong() 和 to_string() 提供 构造 函数 的 道 操作 。 为 了 避免 隐 含 转换 ， 应 优先 选择 
命名 的 转换 操作 而 不 是 转换 运算 符 。 如 果 bitset 的 值 高 位 太 大 ， 无 法 表示 为 一 个 unsigned 





long，to_ulong() 会 抛 出 一 个 overflow_error; to_ullong() 也 是 如 此 。 
幸运 的 是 ，to_string() 返回 的 basic_string 的 模板 实 参 都 有 默认 值 。 例 如 ， 可 以 输出 一 
个 int 的 二 进 制 表示 : 


void binary(int i) 


{ 
bitset<8*sizeof(int)> b = ji 假定 一 个 字 节 是 8 位 〈 另 请 见 40.2 节 ) 
cout << b.to_string<charnchar traits<char>,allocator<char>>() << \n'; /通用 但 宛 长 
cout << b.to_string<char>() << "\n'; // 使 用 默认 的 萃取 和 分 配器 
cout << b.to_string<>() << "\n'; 儿 使 用 所 有 默认 值 
cout << b.to_string() << \n'; 儿 使 用 所 有 默认 值 
} 


这 段 代 码 由 左 至 右 输出 整数 的 二 进 制 表示 中 的 1 和 0， 高 位 在 左 ， 因 此 给 定 实 参 123 将 会 
得 到 : 


00000000000000000000000001111011 
00000000000000000000000001111011 
00000000000000000000000001111011 
00000000000000000000000001111011 


对 于 本 例 ， 直 接 使 用 biset 的 输出 运算 符 更 为 简单 : 


void binary2(int i) 
{ 
bitset<8*sizeof(int)> b = i; 省 假定 一 个 字 节 是 8 位 〈 另 请 见 40.2 节 ) 


cout << b << "\n'; 


34.2.3 vector<bool> 


vector<bool> 定义 在 <vector> 中 ， 它 是 vector ( 见 31.4 节 ) 的 一 个 特例 化 版 本 ， 提 供 
了 二 进 制 位 (bool 值 ) 的 紧凑 存储 : 


template<typename A> 
class vector<bool,A>{ 
public: 

Using const_reference = bool; 

using value_type = bool; 

咱 类 似 vector<T,A> 


/1 vector<T,A> 的 特例 化 版 本 ( 见 31.4 节 ) 


class reference { /| 支持 [0:v.size()) 间 从 0 开始 的 下 标 操作 
friend class vector; 
reference() noexcept; 
pubtic: 
-reference(); 
operator bool() const noexcept; 


reference& operator=(const bool x) noexcept; 
reference& operator=(const reference& x) noexcept; 
void flip() noexcept; 


}; 
void flip() noexcept;// 翻转 v 的 所 有 位 


I... 


liv[i]=x 
lI v[i] = vj)] 
儿 位 翻转 : v[i]=v 
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显然 ，vector<bool> 与 bitset 很 相似 ， 与 bitset 不 同 而 与 vector<T> 相 似 的 是 ，vector 
<bool> 具有 分 配器 ， 也 能 改变 大 小 。 
类 似 vector<T> ，vector<bool> 中 索引 更 大 的 元 素 保存 在 高 地 址 : 





位 置 : (UE 0 
vector<bool> [lo 0 ! 


这 与 bitset 的 内 存 布局 完全 相反 。 而 且 ， 标 准 库 也 提供 将 整数 和 字符 串 直接 转换 为 
vector<bool> 的 操作 。 

可 以 像 使 用 任何 其 他 vector<T> 一 样 使 用 vector<bool>， 但 二 进 制 位 上 的 操作 比 
vector<char> 上 的 操作 要 低 效 得 多 。 而 且 ， 在 C++ 中 不 可 能 完美 模拟 一 个 具有 代理 的 (内 
置 ) 引用 的 行为 ， 因 此 在 使 用 vector<bool> 时 不 要 试图 区 分 右 值 / 左 值 的 微妙 差别 。 





34.2.4 ”元 组 


标准 库 提供 了 两 种 将 任意 类 型 的 值 组 成 单一 对 象 的 方法 : 

e pair 保存 两 个 值 ( 见 34.2.4.1 节 )。 

e tuple 保存 零 个 或 多 个 值 ( 见 34.2.4 节 )。 

如 果 我 们 预先 知道 恰好 有 两 个 值 ，pair 就 很 有 用 处 了 。 而 tuple 用 于 我 们 必须 处 理 任意 
多 个 值 的 情况 。 
34.2.4.1 pair 操作 

在 <utility> 中 ,标准 库 提供 了 类 pair， 用 来 处 理 值 对 : 


template<typename T, typename U> 

struct pair { 
using first_type = T; 外 第 一 个 元 素 的 类 型 
using second type = U; // 第 二 个 元 素 的 类 型 


T first; /第 一 个 元 素 
U second; 外 第 二 个 元 素 


Ws 


}; 
pair<T,U> (iso.20.3.2 ) 

pairp 人 默认 构造 函数 : pair p {T{},U{}}; constexpr 
pair p {x,y} p.first 初始 化 为 x，p.second 初始 化 为 y 
pair p {p2} 从 pair p2 构造 对 象 ; pair p {p2.first,p2.second); 
pair p {piecewise_construct,t,t2} 用 tuple t 的 元 素 构造 p.first; 用 tuple t2 的 元 素 构造 p.second 
p.-pair() 析 构 函数 : 销毁 tfirst 和 tsecond 
p2=p 拷贝 赋值 操作 : p2.first=p.first，p2.second=p.second 
p2=move{p} 移动 赋值 : p2.first=move(p.first)，p2.second=move(p.second) 
p.swap(p2) 交换 p 和 p2 的 值 


若 元 素 上 的 对 应 操作 是 noexcept 的 ， 则 pair 上 的 操作 也 是 noexcept 的 。 类 似 地 ， 如 果 元 
素 类 型 存在 拷贝 或 移动 操作 ， 则 pair 也 有 相应 操作 。 
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成 员 first 和 second 保存 两 个 元 素 ， 我们 可 以 直接 读 写 它们 。 例 如 : 


void f() 

{ 
pair<string,int> p {"Cambridge",1209); 
cout << p.first; /1 输出 "Cambr idge" 
p.second += 800;  // 更 新 年 份 
// … 800 


} 


piecewise_construct 是 一 个 类 型 为 piecewise_construct t 的 对 象 ， 用 来 区 分 构造 成 员 为 
tuple 类 型 的 pair 以 及 用 tuple 作为 初始 化 first 和 second 的 实 参 列表 来 构造 pair。 例 如 : 


struct Univ { 
Univ(const string& n, int r) : name{n}, rank{r} { } 
string name:; 
int rank; 
string city = "unknown"; 
上 
using Tup = tuple<string,int>; 
Tup t1 {"Columbia",11}; 儿 美 国 新 闻 2012 
Tup t2 {"Cambridge",2}; 














pair<Tub,Tub> p1 {t1,t2}; 1 tuple 的 pair 
pair<Univ,Univ> p2 {piecewise_construct,t1,t2}; /Univ 的 pair 


即 ，p1.second 为 t2， 即 {"Cambridge",2}。 与 之 相对 ，p2.second 为 Univ{t2}， 即 
{"Cambridge",2,"unknown"}。 


pair<T,U> 辅助 函数 (iso.20.3.3，iso.20.3.4 ) 








p==p2 p.first==p2.first && p.second==p2.second 

p<p2 p.first<p2.first || (!(p2.first<p.first) && p.second<p2.second) 

pl=p2 !(p==p2) 

p>p2 p2<p 

p<=p2 !(p2<p) 

p>=p2 !(p<p2) 

swap(p,p2) p.swap(p2) 

p=make_pair(x,y) p 是 一 个 pair<decltype(x),decltype(y)>， 保 存 值 xX 和 Yy ; 若 可 能 ， 会 移动 x 
和 yy 而 不 是 拷贝 它们 

tuple_size<T>::value 类 型 T 的 pair 的 大 小 

tuple_element<N,T>::type 若 N==0， 得 到 first 的 类 型 ; 若 N==1， 得 到 second 的 类 型 

get<N>(p) 指向 pair p 的 第 N 个 元 素 的 引用 ; N 必须 是 0 或 1 


函数 make_pair 避免 了 显 式 说 明 pair 的 元 素 类 型 。 例 如 : 


auto p = make_pair("Harvard",1736); 


34.2.4.2 tuple 
在 <tuple> 中 ,标准 库 提供 了 类 tuple 和 各 种 支持 组 件 。 一 个 tuple 就 是 一 个 包含 N 个 
任意 类 型 元 素 的 序列 : 


template<typename... Types> 
class tuple { 


public: 


元 素数 目 为 零 个 或 多 个 。 
对 tuple 的 设计 、 实 现 和 使 用 上 的 细节 ， 请 见 28.5 节 和 28.6.4 节 。 


tuple<Types...> 成 员 (iso.20.4.2 ) 


tuple t {}; 默认 构造 函数 : 空 tuple; constexpr 
tuple t {args}; 用 args 的 元 素 初 始 化 t 的 元 素 ; 显 式 构 造 函 数 
tuple t {t2}; 用 tuple t2 构造 t 

tuple t {p}; 用 pair p 构造 t 

tuple t {allocator_arg_t,a,args}; 用 args 和 分 配器 a 构造 

tuple t {allocator_arg_t,a,t2}; 用 tuple t2 和 分 配器 a 构造 t 

tuple t {allocator_arg_t,a,p}; 用 pair p 和 分 配器 a 构造 t 
t.“tuple() 析 构 函数 : 销毁 每 个 元 素 

t=t2 拷贝 赋值 tuple 

t=move(t2) 移动 赋值 tuple 

t=p 拷贝 赋值 pair p 

t=move(p) 移动 赋值 pair p 

t.swap(t2) 交换 tuple t 和 t2 的 值 ; 不 抛 出 异常 


tuple 的 类 型 与 = 的 运算 对 象 及 swap() 的 实 参 的 类 型 不 必 一 致 。 当 且 仅 当 对 元 素 的 隐 式 操作 
有 效 ， 一 个 tuple 操作 才 有 效 。 例 如 ， 若 一 个 tuple 的 元 素 可 以 赋予 另 一 个 tuple 的 对 应 元 
素 ， 我 们 就 可 以 将 这 个 tuple 赋值 给 后 者 。 例 如 : 


tuple<string,vector<double>,int> t2 = make_tupie("Hello, tuples!",vector<int>{1,2,3},'x'); 


如 果 所 有 元 素 操作 都 是 noexcept 的 ， 则 tuple 操作 也 是 noexcept 的 。 若 某 个 成 员 操 作 抛 
出 异常 ， 则 tuple 也 抛 出 异常 。 类 似 地 ， 若 元 素 操作 是 constexpr 的 ， 则 tuple 操作 也 是 
constexpr 的 。 

一 对 运算 对 象 (或 实 参 ) 的 元 素数 目 必 须 相等 。 

注意 ， 通 用 tuple 的 构造 函数 是 explicit 的 。 特 别 是 ， 下 面 的 代码 不 能 正确 工作 : 


tuple<int,int,int> rotate(tuple<int,int,int> t) 
{ 
return {t.get<2>(),t.get<0>(),t.get<1>()}; // 错 误 : 显 式 tuple 构造 函数 
} 
auto t2 = rotate({3,7,9}); // 错误 : 显 式 tuple 构造 函数 


如 果 你 需要 的 只 是 两 个 元 素 ， 可 以 使 用 pair: 
pair<int,int> rotate(pair<int,int> p) 


{ 
有 


auto p2 = rotate({3,7}); 


更 多 例子 请 见 28.6.4 节 。 


return {p.second,p.first}; 


t=make_tuple(args) 


t=forward_as_tuple(args) 


t=tie(args) 


t=tuple_cat(args) 


tuple_size<T>::value 
tuple_elements<N,T>::type 
get<N>(t) 

t==t2 

t!=t2 

t<t2 

t>t2 

t<=t2 

t>=t2 
uses_allocator<T,A>::value 


swap!(t,t2) 
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tuple<Types...> 辅助 函数 (iso.20.4.2.9 ) 


用 args 创建 tuple 
t 是 一 个 tuple， 包 含 指 向 args 中 元 素 的 右 值 引用 ， 因 此 可 以 利用 t 


转发 args 中 的 元 素 


t 是 一 个 tuple， 包 含 指 向 args 中 元 素 的 左 值 引用 ， 因 此 可 以 利用 tt 
向 args 中 的 元 素 赋值 


连接 tuple : args 是 一 个 或 多 个 tuple ; args 中 tuple 的 成 员 按 序 保 


存在 t 中 


tuple T 的 元 素数 

tuple T 的 第 N 个 元 素 的 类 型 
tuple T 的 第 N 个 元 素 的 引用 
t 和 t2 的 所 有 元 素 都 相等 ? 
tt==t2) 

在 字典 序 中 t 小 于 t2? 

t2<t 

lt>t2) 

lt<t2) 

一 个 tuple<T> 可 以 用 一 个 类 型 为 A 的 分 配器 进行 分 配 吗 ? 
t.swap(t2) 


例如 ，tie() 可 用 来 从 tuple 中 抽取 元 素 : 


auto t = make_tuple(2.71828,299792458,"Hannibal"); 
double c; 
string name; 


tie(c,ignore,name) = ft; l/c=299792458; name="Hannibal" 


对 象 ignore 的 类 型 会 忽略 赋值 ， 因 此 ，tie() 中 的 ignore 表示 忽略 试图 对 tuple 中 它 所 对 应 
的 位 置 的 赋值 。 一 种 替代 方案 是 : 

doubie c = get<0>(t); ll c=299792458 

string name = get<2>(t); ll/name="Hannibal" 
显然 ， 如 果 tuple 来 自 “ 其 他 某 处 ”， 我们 无 法 简单 获知 元 素 值 ， 这 种 方法 就 更 有 价值 了 。 
例如 : 


tupie<int,double,string> compute(); 
ls 

double c; 

string name; 
tie(c,ignore,name) = t; 


34.3 ”资源 管理 指针 

一 个 指针 指向 一 个 对 象 (或 不 指向 任何 东西 )。 但 是 ， 指 针 并 不 能 指出 谁 (如 果 有 的 话 ) 
拥有 对 象 。 即 ， 仅 仅 查看 指针 ， 我 们 得 不 到 任何 关于 “ 谁 应 (或 是 如 何 , 或 是 是 否 ) 删除 对 
象 ” 的 信息 。 在 <memory> 中 ,我 们 可 以 找到 表达 所 有 权 的 “智能 指针 ”: 

e unique_ptr ( 见 34.3.1 节 ) 表示 互 斥 的 所 有 权 

e shared_ptr ( 见 34.3.2 节 ) 表示 共享 的 所 有 权 

e weak_ptr ( 见 34.3.3 节 ) 可 打破 循环 共享 数据 结构 中 的 回路 


儿 结果 保存 在 c 和 name 中 
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这 些 资源 句柄 已 在 5.2.1 节 中 介绍 过 。 
34.3.1 unique_ptr 


unique_ptr (定义 在 <memory> 中 ) 提供 了 一 种 严格 的 所 有 权 语 义 : 
e 一 个 unique_ptr 拥有 一 个 对 象 ， 它 保存 一 个 指针 (指向 该 对 象 )。 即 ，unique_ptr 有 
责任 用 所 保存 的 指针 销毁 所 指向 的 对 象 (如果 有 的 话 )。 
unique_ptr 不 能 拷贝 (没有 拷贝 构造 函数 和 拷贝 赋值 操作 )， 但 可 以 移动 。 
unique_ptr 保存 一 个 指针 ， 当 它 自 身 被 销毁 时 (例如 线程 控制 流离 开 unique_ptr 的 
作用 域 ， 见 17.2.2 节 )， 使 用 关联 的 释放 器 (如 果 有 的 话 ) 释放 所 指向 的 对 象 (如 果 
有 的 话 )。 
unique_ptr 的 用 途 包 括 : 

e 为 动态 分 配 的 内 存 提供 异常 安全 ( 见 5.2.1 节 和 13.3 节 ) 

e 将 动态 分 配 内 存 的 所 有 权 传 递 给 函数 

e 从 函数 返回 动态 分 配 的 内 存 

。 在 容器 中 保存 指针 
我 们 可 以 将 unique_ptr 理解 为 一 个 简单 的 指针 (“包含 指针 ” ) 或 (如 果 有 释放 器 的 话 ) 一 对 指针 : 


up1: up2:| unique_ptr<T,D> | 








对 象 对 象 释放 器 





当 一 个 unique_ptr 被 销毁 时 ， 会 调用 其 释放 器 ( deleter) 销毁 所 拥有 的 对 象 。 释 放 器 表示 销 
毁 对 象 的 方法 。 例 如 : 
e 局 部 变量 的 释放 器 应 该 什么 也 不 做 。 
e 内 存 池 的 释放 器 应 该 将 对 象 归还 内 存 池 ， 是 否 销毁 它 依赖 于 内 存 池 是 如 何 定义 的 。 
e unique_ptr 的 默认 版 本 (“ 无 释放 器 ”) 使 用 delete。 它 甚至 不 保存 默认 的 释放 器 。 
它 可 以 是 一 个 特例 化 版 本 或 依赖 于 空 基 类 优化 ( 见 28.5 节 )。 
这 就 是 unique_ptr 支持 通用 资源 管理 的 方法 ( 见 5.2 节 )。 


template<typename T, typename D = default_delete<T>> 
class unique_ptr { 
public: 
using pointer = ptr; // 包 含 指针 的 类 型 
咱 若 定义 了 D::pointer，ptr 为 D::pointer， 否 则 为 T* 
using element type =T; 
using deleter type = D; 


Hs 


上 
用 户 不 能 直接 访问 包含 指针 。 
unique_ptr<T,D> (iso.20.7.1.2 ) 
cp 为 包含 指针 
unique_ptr up {} 默认 构造 函数 : cp=nullptr; constexpr; 不 抛 出 异常 


unique_ptr up {p} cp=p; 使 用 默认 释放 器 ; 显 式 构造 函数 ; 不 抛 出 异常 


unique_ptr up {p,del} 
unique_ptr up {up2} 
up. unique_ptr() 


up=up2 


up=nullptr 
boel b {up}; 
x=*up 
x=up->m 
x=up[n] 
x=up.get() 
del=up.get_deleter() 
p=up.release() 
up.reset(p) 
up.reset() 
up.swap(up2) 
up==Up2 
up<up2 
up!=up2 
up>up2 
up<=up2 
up>=up2 
swap(up,up2) 
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( 续 ) 


unique_ptr<T,D> (iso.20.7.1.2 ) 


cp 为 包含 指针 

cp=p; 使 用 释放 器 del; 不 抛 出 异常 

移动 构造 函数 : cp.p=up2.p; up2.p=nullptr; 不 抛 出 异常 

析 构 函数 : 若 cp!=nullptr 调用 cp 的 释放 器 

移动 构造 操作 : up.reset(up2.cp) ; up2.cp=nullptr ; up 获得 up2 的 释放 器 ; 
up 的 旧 对 象 (如 果 有 的 话 ) 被 释放 ; 不 抛 出 异常 

up.reset(nullptr); 即 , ,释放 up 的 旧 对 象 (如 果 有 的 话 ) 

转换 为 bool 值 : up.cp!=nullptr; 显 式 构造 函数 

x=up.cp; 只 适用 于 包含 的 对 象 不 是 数组 的 情况 

x=up.cp->m; 只 适用 于 包含 的 对 象 不 是 数组 的 情况 

x=up.cp[m]; 只 适用 于 包含 的 对 象 是 数组 的 情况 

x=up.cp 

del 为 up 的 释放 器 

p=up.cp; Up.cp=nullptr 

如 果 up.cp!=nullptr 对 up.cp 调用 释放 器 ; up.cp=p 

up.cp=pointer{} (可 能 为 nullptr); 对 up.cp 的 旧 值 调用 释放 器 ; 

交换 up 和 up2 的 值 ; 不 抛 出 异常 

up.cp==Uup2.cp 

up.cp<up2.cp 

!(up==up2) 

up2<up 

!(up>up2) 

!(up<up2) 

up.swap(up2) 


注意 ，unique_ptr 不 提供 拷贝 构造 函数 和 拷贝 赋值 运算 符 。 假 如 它 提供 的 话 ,“ 所 有 权 ” 的 
含义 将 会 非常 难以 定义 或 使 用 。 如 果 你 觉得 需要 拷贝 ， 考 虑 使 用 shared_ptr ( 见 34.3.2 市 )。 


我 们 可 以 将 unique_ptr 用 于 内 置 数 组 。 例 如 : 


unique_ptr<int]> make_sequence(int n) 


unique_ptr p {new int[n]}; 

for (int i=0; i<n; ++i) 
plil=i; 

return p; 


} 
这 是 以 特例 化 版 本 的 形式 提供 的 : 


template<typename T, typename D> 
class unique_ptr<T[],D> { 儿 用 于 数组 的 特例 化 版 本 〔( 见 iso.20.7.1.3 ) 
外 默认 的 D=default_delete<T> 来 自 于 通用 版 本 的 unique_ptr 
public: 
1 .… 类 似 单个 对 象 的 unique ptr， 但 提供 [] 而 不 是 * 和 -> .… 
}; 


为 了 避免 切片 ( 见 17.5.1.4 节 )，Derived[] 不 能 作为 unique_ptr<Base[]> 的 实 参 ， 


是 Derived 的 一 个 公有 基 类 也 不 行 。 例 如 : 


即便 Base 


110 沈 四 部 分 丰 准 座 


class Shape { 
We 
}; 
class Circle : public Base { 
}; 


unique_ptr<Shape> ps {new Circle{p,20)}; // 正确 
unique_ptr<Shape[> pa {new Circle[] {Circle{p,20}, Circle{p2,40}}; /| 错误 


我 们 理解 unique_ptr 的 最 好 方式 是 什么 呢 ? 使 用 unique_ptr 的 最 好 方式 又 是 怎样 的 呢 ? 它 
被 命名 为 指针 (_ptr)， 我 也 叫 它 “ 独 享 指针 ”， 但 它 显 然 不 只 是 一 个 普通 指针 (和 否则 定义 它 
就 毫 无 意义 了 )。 考 虑 下 面 这 个 简单 的 技术 示例 : 


unique_ptr<int> f(unique_ptr<int> p) 


++*p; 
return p; 
} 
void f2(const unique_ptr<int>& p) 
{ 
++*p; 
} 
void usel() 
{ 
unique_ptr<int> p {new int{7}}; 
p=f(p); /错误 : 无 拷贝 构造 函数 
p=f(move(p)); /转移 所 有 权 ， 又 转移 回来 
f2(p); 中 传递 引用 
} 


f2() 的 函数 体 比 f() 稍 短 ， 调 用 也 更 简单 些 ， 但 我 觉得 f() 更 容易 理解 。f() 所 展示 的 风格 是 所 
有 权 的 显 式 处 理 (unique_ptr 的 使 用 通常 也 是 为 了 解决 所 有 权 问 题 )。 请 参考 7.7.1 节 中 有 关 
使 用 非 const 引用 的 讨论 。 总 而 言 之 ， 比 起 不 修改 x 的 y=f(x) 方式 ， 修 改 x 的 f(x) 方式 更 容 
易 出 错 。 

合理 估计 : 调用 f2() 会 执行 一 条 或 两 条 机 器 指令 ， 比 调用 f() 更 快 (因为 需要 将 一 个 
nullptr 置 于 原 unique_ptr 中 ), 但 这 一 性 能 差异 很 可 能 并 不 重要 。 男 一 方面 , 与 f() 相 比 ， 
f2() 访问 包含 指针 需要 一 次 额外 的 间接 寻 址 ， 在 大 多 数 程序 中 ， 这 一 差异 同样 不 会 很 重要 。 
因此 ， 选 择 fl() 的 风格 还 是 f2() 的 风格 ， 主 要 取决 于 它们 对 代码 质量 的 影响 。 

下 面 是 一 个 简单 的 示例 ， 展 示 了 如 何 用 释放 器 保证 释放 从 C 程序 片段 中 得 到 的 用 
malloc() ( 见 43.5 节 ) 分 配 的 数据 : 

extern "C" char* get_data(const char* data); // 从 C 程序 片段 获得 数据 





using PtoCF = void(*)(void*); 


void test() 

{ 
unique_ptr<char,PtoCF> p {get_data("my_data"),free}; 
ss: 使 用 

》 儿 隐 式 有 释放 (p) 
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目前 ， 标 准 库 尚未 提供 类 似 make_pair() ( 见 34.2.4.1 节 ) 和 make_shared() ( 见 34.3.2 节 ) 
的 make_unique()。 但 是 ,很 容易 定义 此 函数 : 


template<typename T, typename... Args> 
unique_ptr<T> make_unique(Args&&... args) 儿 默认 释放 器 版 本 
{ 


} 


return unique_ptr<T>{new T{args...}}; 


34.3.2 shared pitr 


shared_ptr 表示 共享 所 有 权 。 当 两 段 代 码 需要 访问 同一 个 数据 ， 但 两 者 都 没有 独 享 所 
有 权 (负责 销毁 对 象 ) 时 ， 可 以 使 用 shared_ptr。shared_ptr 是 一 种 计数 指针 ， 当 计数 变 为 
零 时 释放 所 指向 的 对 象 。 我 们 可 以 将 共享 指针 理解 为 包含 两 个 指针 的 结构 : 一 个 指针 指向 对 
象 ， 另 一 个 指针 指向 计数 器 : 





释放 器 (deleter) 用 来 在 计数 器 变 为 零 时 释放 共享 对 象 。 默 认 释放 器 通常 是 delete〈 它 会 调 
用 对 象 的 析 构 函数 (如果 存 在 的 话 )， 并 释放 自由 存储 空间 )。 
例如 ,考虑 这 样 的 场景 ， 一 个 算法 处 理 图 结构 ， 图 由 Node 构成 ， 算 法 会 添加 、 删 除 
结 点 以 及 结 点 间 的 连接 ( 边 )。 显 然 ， 为 了 避免 内 存 泄漏 ， 当 且 仅 当 没有 其 他 结 点 指向 一 个 
Node 时 应 释放 掉 它 。 我 们 可 以 尝试 : 
struct Node { 
vector<Node*> edges; 
EN 
}; 
给 定 这 样 一 个 设计 ， 回 答 诸 如 “有 多 少 结 点 指向 这 个 结 点 ? ”之 类 的 问题 会 非常 困难 ,我 们 
需要 大 量 额 外 的 “ 杂 务 管理 ”代码 。 我 们 可 以 引入 一 个 垃圾 收集 器 ( 见 34.5 节 ), 但 如 果 图 
结构 只 是 应 用 程序 中 的 一 小 部 分 数据 ， 这 可 能 对 性 能 带 来 负面 影响 。 更 糟 的 是 ， 如 果 容 器 
还 包含 非 内 存 资源 ， 如 线程 句柄 、 文 件 句柄 、 锁 等 ， 即 使 引入 垃圾 收集 器 也 不 会 消除 资源 
作为 替代 ， 我 们 可 以 使 用 shared_ptr: 
struct Node { 
vector<shared_ptr<Node>> edges; 
thread worker; 
人 
此 处 ，Node 的 析 构 函数 ( 隐 式 生成 的 析 构 函数 就 够 用 了 ) 会 删除 其 edges。 即 ， 对 每 个 
edges[i] 都 会 调用 其 析 构 函数 ， 对 其 所 指向 的 Node (如 果 有 的 话 )， 若 edges[i] 已 是 最 后 一 
条 指向 它 的 边 ， 则 释放 此 Node。 
不 要 仅仅 将 shared_ptr 用 来 在 所 有 者 之 间 传 递 指针 ; 这 是 unique_ptr 的 用 途 ，unique _ 
ptr 做 得 更 好 ， 代 价 也 更 低 。 如 果 你 已 经 在 使 用 从 工厂 函数 (或 同类 函数 ) 返回 的 计数 指针 
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( 见 21.2.4 节 )， 考 虑 升级 到 unique_ptr 而 不 是 shared_ptr。 
不 要 为 了 避免 内 存 泄漏 就 不 假 思 考 地 用 shared_ptr 替代 指针 ; shared_ptr 并 非 万 能 妙 
药 ， 而 且 有 额外 代价 : 
e shared_ptr 的 循环 链表 会 导致 资源 泄漏 。 你 需要 一 些 复杂 的 逻辑 来 打破 环 ， 例 如 使 
用 weak_ptr( 见 34.3.3 节 )。 
e 比 起 限定 作用 域 的 对 象 ， 共 享 所 有 权 的 对 象 会 保持 更 长 时 间 的 “活跃 ”( 因 此 会 导致 
更 高 的 平均 资源 占用 )。 
e 多 线程 环境 中 的 共享 指针 代价 很 高 (因为 需要 防止 使 用 计数 上 的 数据 竞争 )。 
e 共享 对 象 析 构 函数 的 执行 时 间 不 可 预测 ， 共 享 对 象 的 更 新 算法 / 逻辑 比 普通 对 象 的 相 
应 算法 /人 逻辑 更 容易 出 错 。 例 如 ， 当 析 构 函数 执行 时 ， 哪 些 锁 被 设置 7 又 有 哪些 文 
件 是 打开 的 ? 一般 而 言 ， 在 析 构 函数 的 执行 时 间 点 (不 可 预测 )， 哪 些 对 象 是 “活跃 ” 
的 且 处 于 恰当 的 状态 ? 
e 如 果 单 一 (最 后 的 ) 结 点 保持 一 个 大 数据 结构 活跃 ， 释 放 它 所 导致 的 析 构 函数 层 笃 调 
用 会 导致 严重 的 “垃圾 收集 延迟 ”。 这 对 实时 响应 是 不 利 的 。 
shared_ptr 表示 共享 所 有 权 ， 这 非常 有 用 ， 甚 至 可 以 说 是 必需 的 ， 但 共享 所 有 权 不 是 我 心 
目 中 的 理想 方式 ， 它 必然 会 有 额外 开销 (与 你 如 何 表 示 共 享 无 关 )。 如 果 一 个 对 象 有 确定 的 
所 有 权 和 确定 、 可 预测 的 生命 周期 ， 应 是 更 好 (也 更 简单 ) 的 方式 。 当 可 以 选择 时 : 


e 优先 选择 unique_ptr 而 不 是 shared_ptr。 
e 优先 选择 普通 限 域 对 象 而 不 是 在 堆 中 分 配 空间 、 由 unique_ptr 管理 所 有 权 的 对 象 。 
shared_ptr 提供 一 组 常规 的 操作 : 


shared_ptr sp {} 
shared_ptr sp {p} 


shared_ptr sp {p,del} 


shared_ptr sp {p,del,a} 
shared_ptr sp {sp2} 


sp. "shared_ptr() 


shared_ptr<T> 操作 (iso.20.7.2.2 ) 
cp 为 包含 指针 ; uc 为 使 用 计数 

默认 构造 函数 : cp=nullptr; uc=0; 不 抛 出 异常 

构造 函数 : cp=p; uc=1 

构造 函数 : cp=p; uc=1; 使 用 释放 器 del 

构造 函数 : cp=p; uc=1; 使 用 释放 器 del 和 分 配器 a 

移动 和 拷贝 构造 函数 : 移动 构造 函数 将 sp2 中 内 容 移 至 sp 并 设置 sp2. 
cp=nullptr; 拷贝 构造 函数 进行 复制 ， 并 递增 当前 共享 的 uc 

析 构 函数 : --uc; 若 uc 变 为 0， 释放 cp 指向 的 对 象 ， 使 用 释放 器 (默认 释放 
器 为 delete) 


sp=sp2 拷贝 赋值 : 递增 当前 共享 的 uc; 不 抛 出 异常 

sp=move(sp2) 移动 赋值 : 对 当前 共享 的 uc 进行 sp2.cp=nullptr; 不 抛 出 异常 

bool b {sp}; 转换 为 bool: sp.uc=nullptr; 显 式 构造 函数 

sp.reset() shared_ptr{}.swap(sp) ; 即 ，sp 包含 pointer{}， 析 构 临 时 变量 shared_ptr{} 


sp.reset(p) 


sp.reset(p,d) 
sp.reset(p,d,a) 


会 递减 旧 对 象 的 引用 计数 ; 不 抛 出 异常 
shared_ptr{p}.swap(sp) ; 即 ，sp.cp=p ; uc==1， 
ptr{} 会 递减 旧 对 象 的 引用 计数 
类 似 sp.reset(p)， 但 使 用 释放 器 d 
类 似 sp.reset(p)， 但 使 用 释放 器 d 和 分 配器 a 


析 构 临时 变量 shared_ 


p=sp.get() p=sp.cp; 不 抛 出 异常 
x=*sp x=*sp.cp; 不 抛 出 异常 
x=sp->m x=sp.cp->m; 不 抛 出 异常 


n=sp.use_count() 


n 为 使 用 计数 的 值 ( 若 sc.cp==nullptr,，n 为 0) 
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( 续 ) 
shared_ptr<T> 操作 (iso.20.7.2.2 ) 
cp 为 包含 指针 ; uc 为 使 用 计数 
sp.unique() sc.uc==1? ( 若 sc.cp==nullptr 不 做 检查 ) 
x=sp.owner_before(pp) x 是 一 个 序 函 数 (严格 弱 序 ; 见 31.2.2.1 节 ); pp 是 一 个 shared_ptr 或 一 个 
weak_ptr 
sp.swap(sp2) 交换 sp 和 sp2 的 值 ; 不 抛 出 异常 


此 外 ， 标 准 库 还 提供 了 一 些 辅助 函数 : 


shared_ptr<T> 辅助 函数 (iso,20.7.2.2.6，iso.20.7.2.2.7 ) 


一 个 sh tr<T>， J 季 图 _. 仆 实 参 » | 
sp=make_shared(args) Sp 是 ts ared_p F<T> [| 理 | 用 实 args 构造 的 类 型 为 T 的 对 象 


用 new 分 配 内 存 
sp 是 一 个 shared_ptr<T>， 管 理 一 个 用 实 参 args 构造 的 类 型 为 T 的 对 象 ; 

sp=allocate_shared(a,args) es a 分 配 内 存 9 
sp==sp2 sp.cp==sp2.cp; sp 和 sp2 可 以 是 nullptr 
sp<sp2 less<T*>(sp.cp,sp2.cp); sp 和 sp2 可 以 是 nullptr 
sp!=sp2 !(sp==sp2) 
sp>sp2 sp2<sp 
sp<=sp2 !(sp>sp2) 
sp>=sp2 !(sp<sp2) 
swap(sp,sp2) sp.swap(sp2) 
pa oiter onst(ep) Bene a static_cast : sp2=shared_ptr<T>(static_cast<T*>(sp.cp); 不 


共享 指针 的 dynamic_cast : sp2=shared_ptr<T>(dynamic_cast<T*>(sp. 
cp)); 不 抛 出 异常 
共享 指针 的 const_cast: sp2=shared_ptr<T>(const_cast<T*>(sp.cp)); 不 


sp2=dynamic_pointer_cast(sp) 


sp2=const_pointer_cast(sp) 


抛 出 异常 
若 ) *dp 器 ， 否 由 = .不 
dp=get_deleter<D>(sp) Rs D 的 释放 器，*dp 为 sp 的 释放 器 ; 否则 ，dp==nullptr ; 不 
Os<<sp 将 sp 写 人 out 
例如 : 
struct S{ 
int i; 
string s; 
double d; 
ll... 
}; 


auto p = make_shared<S>(1,"Ankh Morpork",4.65); 


现在 ，p 是 一 个 shared_ptr<S>， 指 向 一 个 分 配 在 自由 存储 空间 上 的 类 型 为 S 的 对 象 ， 该 对 
象 的 值 为 {1,"Ankh Morpork",4.65}。 
注意 ,与 unique_ptr::get_deleter() 不 同 ，shared_ptr 的 释放 器 不 是 一 个 成 员 函 数 。 


34.3.3 weak_ptr 
weak_ptr 指向 一 个 shared_ptr 所 管理 的 对 象 。 为 了 访问 对 象 ， 可 使 用 成 员 函 数 lock() 


将 weak_ptr 转换 为 shared_ptr。weak_ptr 允许 访问 他 人 拥有 的 对 象 : 

e ( 仅 ) 当 对 象 存 在 时 你 才 需 要 访问 它 

e 对 象 可 能 在 任何 时 间 被 (其 他 人 ) 释放 

e 在 对 象 最 后 一 次 被 使 用 后 必须 调用 其 析 构 函数 (通常 释放 非 内 存 资源 ) 

特别 是 ， 我 们 可 以 用 弱 指 针 打破 shared_ptr 管理 的 数据 结构 中 的 环 。 

我 们 可 以 将 一 个 weak_ptr 理解 为 两 个 指针 : 一 个 指针 指向 (可 能 是 共享 的 ) 对 象 ， 另 
一 个 指针 指向 此 对 象 的 shared_ptr 的 使 用 计数 : 





wp: 














使 用 计数 
释放 器 
弱 使 用 计数 


“ 弱 使 用 计数 ”用 来 保持 使 用 计数 结构 活跃 ， 因 为 在 对 象 的 最 后 一 个 shared_ptr 的 生命 期 结 
束 后 ， 仍 可 能 有 weak_ptr 活跃 。 


template<typename T> 

class weak_ptr { 

public: 
using element type = T; 
// 





}; 
对 weak_ptr 来 说 ,为 了 访问 “ 它 的 ”对 象 ， 我们 必须 将 它 转 换 为 shared_ptr， 为 此 ， 标 准 
库 提供 了 一 些 操 作 : 


weak_ptr<T> 辅助 函数 (iso.20.7.2.3 ) 
cp 为 包含 指针 ; wuc 为 弱 使 用 计数 


weak_ptr wp {}; 默认 构造 函数 : cp=nullptr; constexpr; 不 抛 出 异常 

weak_ptr wp {pp}; 拷贝 构造 函数 : cp=pp.cp ; ++Wuc ; pp 是 一 个 weak_ptr 或 一 个 shared_ 
ptr; 不 抛 出 异常 

wp. weak_ptr() 析 构 函数 : 对 *cp 无 影响 ; --wuc 

wp=pp 拷贝 赋值 : 递减 wuc， 将 wp 设置 为 pp : weak_ptr(pp).swap(wp); pp 是 一 
个 weak_ptr 或 一 个 shared_ptr; 不 抛 出 异常 

wp.swap(wp2) 交换 wp 和 wp2 的 值 ; 不 抛 出 异常 

wp.reset() 递减 wuc， 将 wp 设置 为 nullptr: weak_ptr{}.swap(wp); 不 抛 出 异常 

n=wp.use_count() n 是 指向 *cp 的 shared_ptr 数目 ; 不 抛 出 异常 

wp.expired() 还 有 指向 *cp 的 shared_ptr 吗 ? 不 抛 出 异常 

sp=wp.lock() 创建 一 个 指向 *cp 的 新 shared_ptr; 不 抛 出 异常 

x=wp.owner_before(pp) x 是 一 个 序 函 数 (严格 弱 序 ; 见 31.2.2.1 节 ); pp 是 一 个 shared_ptr 或 一 个 
weak_ptr 

swap(wp,wp2) wp.swap(wp2); 不 抛 出 异常 


考虑 实现 一 个 古老 的 “小 行星 游戏 ” 。 所 有 小 行星 归 “ 游 戏 ” 所 有 ， 但 每 颗 小 行星 必须 跟 
踪 周 围 小 行星 的 运动 以 便 处 理 碰 撞 。 一 次 碰撞 通常 会 毁灭 一 颗 或 多 颗 小 行星 。 每 颗 小 行星 
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必须 维护 一 个 邻居 小 行星 的 列表 。 注 意 ， 在 此 列表 上 并 不 代表 “活跃 ”( 因 此 并 不 适合 使 用 
shared_ptr)。 男 一 方面 ， 当 一 颗 小 行星 被 男 一 颗 小 行星 查看 时 (例如 计算 碰撞 的 结果 )， 它 
不 能 被 销毁 。 而 且 显 然 的 是 ， 必 须 调用 小 行星 的 析 构 函数 来 释放 资源 (例如 与 图 形 系统 的 连 
接 )。 我 们 所 需要 的 是 一 个 可 能 尚 存 的 小 行星 的 列表 以 及 暂时 “ 抓 住 ” 某 颗 小 行星 的 方法 。 
weak_ptr 恰好 能 做 到 : 
void owner() 

Ws 

vector<shared_ptr<Asteroid>> va(100); 

for (int i=0; i<va.size(); ++i) { 

4 … 计算 新 的 小 行星 的 邻居 .… 


valil.reset(new Asteroid(weak_ptr<Asteroid>(va[neighbor])); 
launch(i); 


Wh 
} 


显然 ,我 激进 地 简化 了 “所 有 者 ”"， 并 且 只 给 每 个 新 的 Asteroid 一 个 邻居 。 关 键 点 是 : 对 
一 个 Asteroid， 我 将 它 的 邻居 的 weak_ptr 交 给 了 它 。 所 有 者 保存 一 个 shared_ptr， 表 示 
Asteroid 的 所 有 权 ， 在 它 被 查看 时 所 有 权 将 被 共享 (否则 不 共享 )。Asteroid 的 碰撞 计算 可 
能 像 下 面 这 样 : 


void collision(weak_ptr<Asteroid> p) 


if (auto q=p.lock()){ /plock 返回 指向 p 的 对 象 的 shared ptr 
/| .… 这 颗 Asteroid 仍然 存在 : 计算 .… 


} 
else{ /| 糟糕 : 这 颗 Asteroid 已 经 被 销毁 了 
p.reset(); 
} 
} 


注意 ， 即 使 用 户 决 定 结 束 游戏 并 释放 所 有 Asteroid (通过 销毁 表示 所 有 权 的 shared_ptr)， 
每 颗 正 在 计算 碰撞 的 Asteroid 仍 会 正确 结束 : 执行 p.lock() 所 获得 的 shared_ptr 此 时 不 会 
变 成 无 效 。 


34.4 ”分 配器 


STL 容器 ( 见 31.4 节 ) 和 string ( 见 第 36 章 ) 都 是 资源 句柄 ， 获 取 和 释放 内 存 来 保存 其 
元 素 。 为 此 ， 它 们 使 用 分 配器 (allocator)。 分 配器 的 基本 目的 是 为 给 定 类 型 提供 内 存 资 源 以 
及 提供 在 内 存 不 再 需要 时 将 其 归还 的 地 方 。 因 此 ， 基 本 的 分 配器 函数 有 : 

p=a.allocate(n); 儿 为 n 个 类 型 为 了 的 对 象 获取 空间 

a.deallocate(p,n); /| 释放 p 所 指向 的 保存 mn 个 类 型 为 工 的 对 象 的 空间 


例如 : 


template<typename T> 
struct Simple_alioc { 咱 用 new[] 和 delete[] 分 配 和 释放 空间 
using value type = Ti; 


Simple_alloc() 分 


T* allocate(size_tn) 
{ return reinterpret_cast<T*>(new char[n*sizeof(T)]); } 
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void deallocate(T* p, size_t n) 
{ delete[] reinterpret_cast<char:>(p); } 


上 
Simple_alloc 是 最 简单 的 标准 分 配器 。 注 意 ， 转 换 为 char*: allocate() 以 及 从 char*: allocate() 
转换 不 会 调用 构造 函数 ， 而 deallocate() 不 会 调用 析 构 函数 ; 它们 处 理 的 是 内 存 ， 而 非 强 类 
型 的 对 象 。 

我 可 以 构造 自己 的 分 配器 来 从 任意 内 存 区 域 分 配 空间 : 


class Arena { 


voidx p; 
int s; 
public: 
Arena(void* pp, int ss); // 从 p[0..ss-1] 分 配 空间 
六 
template<typename T> 
struct My_alloc { 咱 使 用 一 个 Arena 分 配 释 放空 间 
Arena& ai 


My_alloc(Arena& aa) : a(aa) {} 
My_alloc() 分 
/通常 的 分 配器 成 员 
}; 
一 旦 创建 了 Arena， 就 可 以 在 分 配 的 内 存 上 构造 对 象 了 : 


constexpr int sz {100000}; 
Arena my_arenai{new char[sz],sz}; 
Arena my_arena2{new char[10*sz],10*sz)}; 


vector<int> v0;// 使 用 默认 分 配器 分 配 

vector<int,My_alloc<int>> v1 {My_alloc<int>{my_arena1}}; /在 my_arenal 中 构造 对 象 
vector<int,My_alloc<int>> v2 {My_alloc<int>{my_arena2)}}; /在 my _arena2 中 构造 对 象 
vector<int,Simple_alloc<int>> v3; /在 自由 存储 空间 上 构造 对 象 


通常 ， 我 们 可 以 使 用 别名 简化 宛 长 的 描述 。 例 如 : 


template<typename T> 

using Arena_vec = std::vector<T,My_alloc<T>>; 
template<typename T> 

using Simple_vec = std::vector<T,Simple_alloc<T>>; 


My_alloc<int> Alloc2 {my_arena2}; 川 命名 的 分 配器 对 象 
Arena_vec<complex<double>> vcd {{{1,2}, {3,4}}, Alloc2}; 儿 显 式 分 配器 
Simple_vec<string> vs {"Sam Vimes", "Fred Colon", "Nobby Nobbs }; / 儿 软 认 分 配器 


一 个 分 配器 只 有 当 其 对 象 真正 具有 状态 时 (类似 My_alloc) 才 会 增加 容器 中 的 内 存 开销 ， 这 
通常 是 依赖 空 基 类 优化 〈 见 28.5 节 ) 实现 的 。 


34.4.1 默认 分 配器 
所 有 标准 库容 器 都 (默认 ) 使 用 默认 分 配器 ， 它 用 new 分 配 空间 ， 用 delete 释放 空间 。 


舅 34 葛 内 闻 和 次 源 117 





template<typename T> 

class allocator { 

public: 
using size type = size i; 
using difference_ type = ptrdiff_t; 
using pointer = T::; 
using const_pointer = const T#; 
using reference = T&; 
using const_reference = const T&; 
using value_type = T; 


template<typename U> 
struct rebind { using other = allocator<U>; }; 


allocator() noexcept; 
aliocator(const allocator&) noexcept; 
template<typename U> 

allocator(const allocator<U>&) noexcept; 
"allocator(); 


pointer address(reference x) const noexcept; 
const_pointer address(const_reference x) const noexcept; 


pointer allocate(size_type n, allocator<void>::const_pointer hint = 0); 儿 分 配 n 个 字 节 
void deallocate(pointer p, size_type n); 川 释放 nn 个 字 节 


size_ type max_size() const noexcept; 


template<typename U, typename... Args> 
void construct(U* p, Args&&... args); lnew(p) U {args} 


template<typename U> 
void destroy(U:* p); //p-> UO 
}; 


奇怪 的 rebind 模板 是 一 个 过 时 的 别名 ， 更 好 的 方式 本 应 是 这 样 : 


template<typename U> 
using other = allocator<U>; 


但 是 ， 在 C++ 支持 这 种 别名 之 前 ， 就 已 有 allocator 的 定义 了 。 这 个 别名 的 作用 是 允许 分 配 
器 分 配 任意 类 型 的 对 象 。 考 虑 下 面 的 代码 : 


using Link_alloc = typename A::template rebind<Link>::other; 


若 人 A 是 一 个 allocator， 则 rebind<Link>::other 是 allocator<Link> 的 一 个 别名 。 例 如 : 


template<typename T, typename A = allocator<T>> 
class list { 
private: 

class Link {/*... */); 


using Link_alloc = typename A:: template rebind<Link>::other;  //allocator<Link>> 


Link_alloc a; /链表 分 配器 
A alloc; / 儿 列 表 分 配器 
1s 

上 


allocator<T> 还 有 一 个 更 严格 的 特例 化 版 本 : 
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template<> 
class allocator<void> { 
public: 
typedef void: pointer; 
typedef const void:* const_pointer; 
typedef void value type:; 
template<typename U> struct rebind { typedef allocator<U> other; }; 


}; 
这 使 我 们 能 避免 这 种 特殊 情况 : 我 们 可 以 使 用 allocator<void> ， 只 要 不 解 引 用 其 指针 即 可 。 


34.4.2 ”分 配器 萃取 


分 配器 是 用 allocator_traits“ 联 系 在 一 起 ”的 。 分 配器 的 一 个 属性 ， 比 如 说 其 pointer 
类 型 ， 可 以 在 其 茜 取 中 找到 : allocator_traits<X>::pointer。 与 往常 一 样 ， 使 用 萃取 技术 使 
得 我 们 可 以 为 一 个 类 型 构建 分 配器 ， 该 类 型 的 成 员 类 型 可 以 不 满足 分 配器 的 要 求 ， 例 如 int， 
或 是 该 类 型 设计 时 就 未 考虑 任何 分 配器 相关 问题 。 

基本 上 ，allocator_traits 为 常用 类 型 别名 和 分 配器 函数 集合 提供 了 默认 值 。 与 默认 
allocator ( 见 34.4.1 节 ) 相 比 ， 缺 少 了 address()， 但 增加 了 select_on_container_copy_ 
construction(): 


template<typename A> 儿 见 iso.20.6.8 
struct allocator traits { 

using allocator_type = A; 

using value_type = A::value_type; 





using pointer = value_type; /花招 
using const_pointer = Pointer_traits<pointer>::rebind<const value_type>; /花招 
using void_pointer = Pointer_traits<pointer>::rebind<void>; /花招 
using const_void_pointer = Pointer_traits<pointer>::rebind<const void>; /| 花招 
using difference_type = Pointer_traits<pointer>::difference_type; /花招 
using size_type = Make_unsigned<difference_type>; 儿 花招 
using propagate_on_container_copy_assignment = false_type; 咱 花 招 
using propagate_on_container_move_assignment = false_type; 中 花招 
using propagate_on_container_swap = false_type; 咱 花 招 
template<typename T> using rebind_alloc = A<T,Args>; /花招 
template<typename T> using rebind_traits = Allocator traits<rebind_alloc<T>>; 

static pointer allocate(A& a, size_type n) { return a.allocate(n); } 咱 花 招 
static pointer allocate(A& a, size_type n, const_void_pointer hint) 咱 花 招 





{return a.allocate(n,hint); } 
static void deallocate(A& a, pointer p, size_type n) { a.deallocate(p, n); } 咱 花 招 


template<typename T, typename... Args> 
static void construct(A& a, Ti p, Args&&... args) /花招 
{ ::new (static_cast<void*>(p)) T(std::forward<Args>(args)...); } 
template<typename T> 
static void destroy(A& a, T# p) { p->T(); } 咱 花 招 


static size_type max_size(const A& a) 咱 花 招 
{ return numeric_limits<size_type>::max() } 
static A select_on_container_copy_construction(const A& rhs) { return a; } // 花招 


}; 
如 果 分 配器 A 的 对 应 成 员 存 在 ， 则 可 使 用 “花招 ”来 访问 ; 否则 ,使 用 这 里 指定 的 默认 值 。 
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对 allocate(n,hint)， 若 A 没有 接受 一 个 提示 参数 的 allocate()， 则 A::allocate(n) 会 被 调用 。 
args 是 A 所 需 的 任何 类 型 参数 。 

我 不 喜欢 在 标准 库 的 定义 中 使 用 这 样 的 小 花招 ， 但 enable_if() 的 自由 使 用 ( 见 28.4 节 ) 
使 得 这 种 花招 可 用 C++ 实现 。 

为 了 令 声 明 的 可 读 性 更 高 ， 我 假定 已 经 定义 了 一 些 类 型 别名 。 


34.4.3 ”指针 萃取 
分 配器 用 pointer_traits 确定 指针 及 指针 代理 类 型 的 属性 : 


template<typename P> 儿 见 iso.20.6.3 
struct pointer_traits { 
using pointer = P; 


using element type =T; 儿 花 招 
using difference_type = ptrdiff_t; 川 花招 
template<typename U> 

using rebind = T*; /花招 
static pointer pointer_ to(a); /花招 


》 


template<typename T> 
struct pointer traits<T*>{ 
using pointer = T*; 
using element_type = T; 
using difference_type = ptrdiff_t; 
template<typename U> 
using rebind = Ux*; 


static pointer pointer_to(x) noexcept { return addressof(x); } 
}; 
“花招 ”的 使 用 与 allocator_traits 相同 ( 见 34.4.2 节 ) : 如 果 指 针 P 的 对 应 成 员 存 在 ， 则 使 
用 “花招 ”; 否则 ， 使 用 指定 的 默认 值 。 为 了 使 用 T， 模 板 参数 P 必须 是 模板 Ptr<T,args> 
的 第 一 个 参数 。 
此 说 明 违 反 了 C++ 语言 规范 。 


34.4.4” 限 域 的 分 配器 


当 使 用 容器 和 用 户 自 定义 分 配器 时 ， 会 产生 一 个 相当 琼 手 的 问题 : 元 素 应 该 位 于 与 容器 
相同 的 内 存 区 域 吗 ? 例如 ， 如 果 你 使 用 Your_allocator 为 Your_string 分 配 其 元 素 ， 而 我 使 
用 My_allocator 分 配 My_vector 的 元 素 ， 那 么 对 My_vector<Your_string> 中 的 字符 串 元 素 
应 该 使 用 哪个 分 配器 呢 ? 








解决 方案 是 要 具备 告知 一 个 容器 传递 给 元 素 何 种 分 配器 的 能 力 。 做 到 这 一 点 的 关键 是 
scoped_allocator 类 ， 它 提供 了 一 种 机 制 来 跟踪 外 部 分 配器 (用 于 元 素 ) 和 内 部 分 配器 〈 传 





递 给 元 素 供 它们 所 用 ): 


template<typename OuterA, typename... InnerA> li 见 iso.20.12.1 
class scoped allocator_adaptor : public OuterA { 
Private: 
using Tr = aliocator traits<OuterA>; 
public: 
using outer_aliocator type = OuterA; 
using inner_allocator type = see below; 


using value_type = typename Tr::value_type; 

using size_type = typename Tr::size_type; 

using difference_type = typename Tr::difference_type; 

using pointer = typename Tr::pointer; 

using const_pointer = typename Tr::const_pointer; 

using void_pointer = typename Tr::void_pointer; 

using const_void pointer = typename Tr::const_void_pointer; 

using propagate_on_container copy_assignment=/* 见 iso.20.12.2 */; 
using propagate_on_container_move_ assignment=/* 见 iso.20.12.2 */; 
using propagate_on_container_swap =/* 见 iso.20.12.2 */; 


我 们 有 4 种 方案 可 解决 string 的 vector 的 分 配 问题 : 


中 vector 和 string 使 用 它们 自己 (默认 ) 的 分 配器 : 
using svec0 = vector<string>; 
Svec0 v0; 


livector ( 仅 ) 使 用 My alloc，string 使 用 它 自 己 (默认 ) 的 分 配器 : 
Using Svec1 = vector<string,My_alioc<string>>; 
Svec1 v1 {My_alloc<string>{my_arena1}}; 


livector 和 string 使 用 My alloc (同上 ): 

using Xstring = basic_string<char,char_traits<char>, My_alloc<char>>; 

using Svec2 = vector<Xstring,scoped_allocator_adaptor<My_ailoc<Xstring>>>; 
Svec2 v2 {scoped _ allocator adaptor<My _alloc<Xstring>>{my_arena1}}; 


/vector 使 用 它 自 己 〈 黑 认 ) 的 分 配器 ，string 使 用 My alloc: 

using Xstring2 = basic_string<char char_traits<char>, My_alloc<char>>; 

using Svec3 = vector<xstring2,scoped _allocator_adaptor<My_alloc<xstring>,My_alioc<char>>>; 
Svec3 v3 {scoped allocator adaptor<My _alloc<xstring2>,My_alloc<char>>{my_arena1}}; 


显然 ， 第 一 个 版 本 Svec0 是 到 目前 为 止 最 常用 的 ,但 使 系统 有 严重 的 内 存 相关 的 性 能 局 限 ， 
因此 其 他 版 本 (特别 是 Svec2) 可 能 有 重要 意义 。 使 用 一 些 别名 可 能 可 以 提高 这 段 代 码 的 可 
读 性 , 但 好 的 一 面 是 这 不 是 你 每 天 都 要 写 的 那 类 代码 。 

scoped_allocator_adaptor 的 定义 有 些 难 理解 ， 但 基本 上 它 是 一 个 非常 像 默 认 allocator 
( 见 34.4.1 节 ) 的 分 配器 ， 只 是 有 能 力 跟踪 传递 给 包含 的 容器 (如 string) 使 用 的 “内 部 ”分 
配器 : 





scoped allocator_adaptor<OuterA,InnerA> (简写 ， 见 iso.20.12.1 ) 
rebind<T>::other 此 分 配器 分 配 类 型 为 T 的 对 象 的 版 本 的 别名 
x=a.inner_allocator() x 为 内 部 分 配器 ; 不 抛 出 异常 
x=a.outer_allocator() x 为 外 部 分 配器 ; 不 抛 出 异常 
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( 续 ) 
scoped_allocator_adaptor<OuterA,InnerA> (简写 ， 见 iso.20.12.1 ) 
p=a.allocate(n) 为 n 个 value_type 类 型 的 对 象 获取 空间 
p=a.allocate(n,hint) 为 n 个 value_type 类 型 的 对 象 获取 空间 ，hint 是 分 配器 的 辅助 提示 ， 具 体内 容 
依赖 于 实现 ， 通 常 是 一 个 对 象 指针 ， 我 们 希望 *p 的 位 置 与 它 接近 
a.deallocate(p,n) 释放 p 指向 的 n 个 value_type 类 型 的 对 象 的 空间 
n=a.max_size() n 是 允许 分 配 的 最 大 元 素数 
t=a.construct(args) 从 args 构造 一 个 value_type 对 象 : t=new(p) value_type{args} 
a.destroy(p) 销毁 *p: p->”value_type() 


34.5 垃圾 收集 接口 


垃圾 收集 (自动 回收 无 引用 的 内 存 区 域 ) 有 时 被 认为 是 万 能 灵 药 ， 但 它 并 不 是 。 特 别 
是 ,垃圾 收集 器 可 能 无 法 避免 并 非 纯 内 存 的 资源 的 泄漏 ， 例 如 文件 句柄 、 线 程 句 顶 以 及 锁 。 
我 将 垃圾 收集 看 作 下 列 常 见 的 防 泄漏 技术 都 已 用 尽 时 的 最 后 一 种 方便 的 手段 : 
[1] 只 要 可 能 ， 应 使 用 具有 正确 语义 的 资源 句柄 来 防止 应 用 程序 中 的 资源 泄漏 。 标 准 
库 提供 了 string 、vector、unordered_map 、thread 、lock_guard 以 及 其 他 很 多 
资源 句柄 。 移 动 语义 允许 从 函数 高 效 返回 这 类 对 象 。 
[2] 使 用 unique_ptr 保存 这 样 的 对 象 : 不 隐 式 管理 其 所 拥有 资源 (如 指针 )、 需 要 免 受 
不 成 熟 释 放 机 制 之 害 (因为 它们 没有 适合 的 析 构 函数 ) 或 是 需要 特别 关注 分 配方 
式 〈 释 放 器 )。 
[3] 使 用 shared_ptr 保存 需要 共享 所 有 权 的 对 象 。 
如 果 坚 持 使 用 这 一 系列 技术 ， 可 确保 不 会 发 生 泄漏 ( 即 ， 没 有 垃圾 内 存 产 生 ， 从 而 也 就 
不 需要 垃圾 收集 )。 但 是 ， 现 实 世 界 中 的 大 量程 序 并 没有 坚持 一 致 地 使 用 这 些 技术 (都 基于 
RAII ; 见 13.3 节 )， 而 且 也 很 难 这 样 做 ， 因 为 其 中 涉及 海量 用 不 同方 式 构建 的 代码 。“ 不 同 
方式 ”通常 包括 复杂 的 指针 使 用 、 裸 new 和 delete、 模 糊 了 资源 所 有 权 的 显 式 类 型 转换 以 
及 其 他 类 似 的 易 错 的 低层 技术 。 在 这 些 情况 下 ， 垃 圾 收集 器 是 适合 的 最 后 手段 。 它 可 以 回收 
内 存 ， 但 不 能 处 理 非 内 存 资源 ， 你 甚至 不 要 想 在 收集 时 调用 通用 的 “终止 化 器 ”来 处 理 非 内 
存 资源 。 垃 圾 收集 器 有 了 时 能 显著 延长 发 生 泄漏 的 系统 的 运行 时 间 (即使 系统 泄漏 的 是 非 内 存 
资源 )。 例 如 ， 对 于 一 个 每 晚 关机 维护 的 系统 ， 垃 圾 收集 器 可 能 将 资源 耗 尽 的 间隔 从 几 小 时 
延长 到 几 天 。 而 且 ， 我们 还 可 以 部 署 垃圾 收集 器 来 查找 泄漏 源 。 
需要 记 住 ， 具 有 垃圾 收集 功能 的 系统 还 是 可 能 有 其 他 形式 的 泄漏 。 例 如 ， 如 果 我 们 将 一 
个 对 象 指针 存 人 一 个 哈 希 表 ， 但 忘 了 它 的 关键 字 ， 则 对 象 实际 上 就 是 泄漏 了 。 类 似 地 ， 被 一 
个 无 限 执行 的 线程 引用 的 资源 会 永远 存活 ， 即 使 线程 并 非 是 想 无 限 执行 (例如 ， 它 在 等 待 输 
入 ,但 一 直 没 有 到 来 )。 有 时 ， 资源 “活跃 ”过 长 时 间 对 系统 而 言 与 永久 泄漏 一 样 糟糕 。 
基于 这 一 基本 思想 ，C++ 将 垃圾 收集 作为 可 选项 。 只 有 显 式 安装 并 激活 ， 才 会 调用 垃圾 
收集 器 。 垃 圾 收集 器 甚至 不 是 一 个 标准 C++ 实现 必须 提供 的 部 分 ,但 目前 已 有 一 些 优秀 的 
免费 和 商用 垃圾 收集 器 。C++ 定义 了 垃圾 收集 器 可 以 做 什么 ， 并 定义 了 ABI (应 用 二 进 制 接 
口 ，Application Binary Interface) 来 帮助 控制 其 行为 。 
针对 指针 和 生命 周期 的 规则 是 用 安全 派生 指针 ( safely-derived pointer， 见 iso.3.7.4.3 )。 
安全 派生 指针 (大致 ) 就 是 “指向 new 分 配 的 某 物 或 其 子 对 象 的 指针 ”。 有 一 些 指 针 不 是 安 
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全 派生 的 例子 ， 我 们 称 之 为 伪装 指针 (disguised pointer)。 例 如 ， 将 指针 指向 “别处 ”一 段 
时 间 : 

int: p = new int[100]; 

p+=10; 

//… 这 期 间 收 集 器 可 能 会 执行 ..…. 

p-=10; 

*p 三 10; /|/ 我们 能 确保 这 个 int 还 在 吗 ? 


将 指针 隐藏 在 一 个 int 中 : 


int* p = new int; 

int x = reinterpret_cast<int>(p); 省 甚至 不 可 移植 
p = nullptr; 

咱 .… 这 期 间 收 集 器 可 能 会 执行 .… 

p = reinterpret_cast<int*>(x); 

xp= 10; /我 们 能 确保 这 个 int 还 在 吗 ? 


将 指针 写 和 文件， 随后 又 读 出 来 : 


int* p = new int; 

cout << p; 

p = nuliptr; 

/ … 这 期 间 收集 器 可 能 会 执行 .. 

cin >> p; 

*p 三 10; /我 们 能 确保 这 个 int 还 在 吗 ? 


或 使 用 “XOR 花招 ”压缩 双向 链表 : 


using Link = pair<Value,long>; 


long xor(Link* pre, Link* suc) 

{ 
static_assert(sizeof(Link*)<=sizeof(long),"a long is smaller than a pointer"); 
return long{pre} longfsuc}; 


} 


void insert_between(Value val, Link: pre, Link* suc) 


{ 
Link* p = new Link{val,xor(pre,suc)}; 
pre->second = xor(xor(pre->second,suc),p); 
suc->second = xor(p,xor(suc->second,pre)); 


} 


使 用 这 个 花招 ， 保 存 的 所 有 指针 都 是 伪装 的 。 

如 果 你 希望 程序 行为 良好 、 对 普通 人 易于 理解 ， 就 不 要 使 用 这 些 花 招 ， 即 使 在 你 不 准备 
使 用 垃圾 收集 器 的 情况 下 也 是 如 此 。 还 有 很 多 甚至 更 糟糕 的 花招 ， 例 如 将 一 个 指针 的 二 进 制 
位 散布 到 多 个 机 器 字 中 。 

确实 存在 伪装 指针 的 正当 理由 (例如 ， 对 内 存 极 度 受 限 的 应 用 使 用 XOR 花招 )， 但 数量 
远 没 有 一 些 程序 员 认 为 的 那样 多 。 

如 果 一 个 伪装 指针 的 位 模式 在 内 存 中 用 错误 类 型 保存 (例如 Iong 或 char[4]) 且 仍 
然 正确 对 齐 的 话 ， 仍 可 能 被 一 个 仔细 的 垃圾 收集 器 所 发 现 。 这 种 指针 被 称 为 可 追踪 的 
(traceable ) 。 

标准 库 允 许 程序 指定 哪里 不 会 有 指针 (例如 ， 一 幅 图 像 中 ) 以 及 哪些 内 存 区 域 即使 没有 
指针 引用 它们 也 不 应 被 回收 ( 见 iso.20.6.4 ): 
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void declare_reachable(void: p); /Hp 指向 的 对 象 不 能 被 回收 
template<typename T> 
T* undeclare_reachable(T: p); /撤销 一 次 declare_reachable() 





void declare_no_pointers(char: p, size_t n); /fp[0:n) 中 没有 指针 
void undeclare_no_pointers(char* p, size_t n); /撤销 一 次 declare_no_pointers() 


C++ 垃圾 收集 器 传统 上 是 保守 收集 器 (conservative collector) ; 即 ， 它 们 不 移动 内 存 中 的 对 

象 且 假 定 内 存 中 的 每 个 字 都 可 能 包含 指针 。 保 守 垃 圾 收集 的 高 效 性 其 实 超过 了 人 们 对 它 的 看 

法 ， 特 别 是 当 一 个 程序 不 生成 大 量 垃圾 时 ， 但 使 用 declare_no_pointers() 安全 地 将 大 部 分 内 

存 拘 除 出 检查 范围 会 令 其 更 为 高 效 。 例 如 ， 我 们 可 以 用 declare_no_pointers() 告知 收集 器 应 

用 中 哪 部 分 内 存 保存 的 是 我 们 的 照片 ， 从 而 允许 收集 器 忽略 可 能 数 GB 并 没有 指针 的 内 存 。 
程序 员 可 以 询问 哪些 指针 安全 性 规则 和 回收 规则 是 有 效 的 : 


enum class pointer_safety {relaxed, preferred, strict }; 


pointer_safety get_pointer_safety(); 


C++ 标准 的 回答 是 ( 见 iso.3.7.4.3 ) :“ 如 果 一 个 指针 值 不 是 安全 派生 指针 值 ， 则 它 是 一 个 非 
法 指针 值 ， 除 非 被 引用 的 完整 对 象 是 动态 存储 期 且 之 前 曾 被 声明 为 可 达 的 …… 使 用 一 个 非法 
指针 值 (包括 将 其 传递 给 一 个 释放 函数 ) 的 结果 是 未 定义 的 ”。 
上 面 的 枚 举 值 的 含义 是 : 
e relaxed : 同等 对 待 安 全 派生 和 非 安全 派生 的 指针 ( 像 C 和 C++98 中 那样 )。 所 有 没 
有 安全 派生 指针 或 可 追踪 指针 引用 的 对 象 都 会 被 回收 。 
e preferred : 类 似 relaxed， 但 垃圾 收集 器 可 能 作为 泄漏 检测 器 或 “ 坏 指针 ” 解 引用 检 
测 器 运行 。 
e strict : 安全 派生 和 非 安 全 派生 的 指针 可 能 会 被 区 别 对待 ;， 即 ， 垃 圾 收集 器 会 忽略 非 
安全 派生 的 指针 。 
没有 标准 方法 表达 你 倾向 于 哪 种 方式 ， 你 可 以 将 此 理解 为 一 个 实现 质量 问题 或 是 编程 环境 
问题 。 


34.6 ”未 初始 化 内 存 


大 多 数 情况 下 ， 最 好 避免 使 用 未 初始 化 的 内 存 。 这 样 做 可 以 简化 编程 ， 消 除 很 多 错误 。 
但 是 ， 在 极 少 数 情况 下 ， 例 如 当 编 写 内 存 分 配器 、 实 现 容 器 以 及 直接 处 理 硬 件 时 ， 直 接 使 用 
未 初始 化 内 存 ， 也 称 为 裸 内 存 (raw memory)， 是 必要 的 。 

除了 标准 的 allocator，<memory> 头 文件 还 提供 了 fil* 系列 函数 用 于 处 理 未 初始 化 内 
存 ( 见 32.5.6 节 )。 它 们 都 是 使 用 一 个 类 型 名 T 引 用 一 块 足以 容纳 一 个 下 类 型 对 象 的 空间 而 
非 引 用 一 个 正确 构造 的 T 类 型 对 象 ， 这 很 危险 ， 但 偶尔 又 是 必需 的 。 这 些 函 数 主 要 是 为 容器 
和 算法 的 实现 者 所 用 。 例 如 ， 使 用 这 些 函 数 实现 reserve() 和 resize() 是 最 容易 的 方法 ( 见 
13.6 节 )。 


34.6.1 临时 缓冲 区 


算法 常常 需要 临时 空间 来 获得 满意 的 性 能 。 通 常 ， 这 种 临时 空间 最 好 通过 一 个 操作 进行 
分 配 ， 但 不 进行 初始 化 ， 直 至 真正 需要 特定 位 置 时 才 进 行 初始 化 。 为 此 ， 标 准 库 提供 了 一 对 
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函数 分 配 和 释放 未 初始 化 空间 : 


template<typename T> 

pair<T*,ptrdiff_t> get_temporary_buffer(ptrdiff_t); // 分 配 但 不 初始 化 
template<typename T> 

void return_temporary_buffer(T*); /| 释放 但 不 销毁 


get_temporary_buffer<X>(n) 操作 尝试 为 n 个 或 更 多 类 型 为 X 的 对 象 分 配 空间 。 如 果 成 功 ， 
它 返 回 指向 未 初始 化 空间 起 始 地 址 的 指针 以 及 这 片 空间 可 以 容纳 多 少 个 类 型 为 X 的 对 象 ; 否 
则 ，pair 的 second 值 为 0。 实 现 思路 是 一 个 系统 需要 时 刻 保持 足够 的 空间 用 于 快速 分 配 ， 
使 得 为 n 个 给 定 大 小 的 对 象 分 配 空间 的 请 求 能 够 得 到 多 于 n 个 的 空间 。 但 是 ， 也 可 能 得 到 更 
少 的 空间 ， 因 此 一 种 使 用 get_temporary_buffer() 的 方法 是 乐观 地 请 求 大 量 空间 ， 然 后 使 用 
获得 的 可 用 空间 。 

通过 get temporary_buffer() 获得 的 缓冲 区 必须 调用 return_temporary_buffer() 释放 
才能 作 他 用 。 类 似 get_temporary_buffer() 只 分 配 不 构造 ，return_temporary_buffer() 只 释 
放 不 销毁 。 由 于 get_temporary_buffer() 是 低层 特性 且 可 能 专门 为 管理 临时 缓冲 优化 ， 因 此 
不 能 用 其 替代 new 或 allocator::allocate() 来 分 配 长 期 使 用 的 内 存 。 


34.6.2 raw_storage_iterator 


写 序 列 的 标准 算法 假定 序列 中 的 元 素 都 已 进行 了 初始 化 。 即 ， 算 法 用 赋值 操作 而 非 找 
贝 构造 实现 写 人 。 因 此 ， 我 们 不 能 用 未 初始 化 的 内 存 作为 算法 的 直接 目标 。 这 可 能 很 糟 ， 因 
为 赋值 的 代价 可 能 比 初始 化 高 得 多 ， 而 且 初 始 化 后 立即 覆盖 也 是 一 种 浪费 。 解 决 方法 是 使 用 
<memory> 中 定义 的 raw_storage_iterator 来 进行 初始 化 而 不 是 赋值 : 


template<typename Out, typename T> 

class raw _storage_iterator : public iterator<output_iterator_tag,void,void,void,void> { 
Out p; 

public: 
explicit raw_storage_iterator(Out pp) : p{pp} {} 
raw_storage_iterator& operator*() { return *this; } 


raw_storage_iterator& operator=(const T& val) 


{ 

new(&*p) T{val}; 。 /1/ 将 val 置 于 *p 中 ( 见 11.2.4 节 ) 

return *this; 
} 
raw_storage_iterator& operator++() {++p; return *this; } 咱 前 置 递增 
raw_storage_iterator operator++(int) 儿 后 置 说 增 
{ 

auto t = *this; 

++p; 

return t; 
} 


上 
raw_storage_iterator 绝 不 能 用 于 写 入 已 初始 化 的 数据 。 这 限制 了 它 在 容器 和 算法 的 深层 实 
现 中 的 应 用 。 考 虑 生成 一 组 string 的 排列 ( 见 32.5.5 节 ) 用 于 测试 : 


void test1() 


{ 
auto pp = get_temporary_buffer<string>(1000);  // 获取 未 初始 化 空间 


务 34 划 内 站 和 和 葵 源 125 





if (pp.second<1000) { 


} 


几 … 处 理 分 配 错误 … 


auto p = raw_storage iterator<string*,string>(pp.first); // 迭代 器 
generate_n(p,a.size()， 


[&]{ next_permutation(seed,seed+sizeof(seed)-1); return seed; }); 


Wass 
return_temporary_buffer(p); 


} 


这 个 例子 有 些 不 自然 ， 因 为 如 果 为 字符 串 分 配 默认 初始 化 的 空间 然后 赋值 测试 字符 串 的 话 也 
没有 什么 错误 。 而 且 ， 它 不 能 使 用 RAIT ( 见 5.2 节 和 13.3 节 )。 


注意 


，raw_storage_iterator 没有 == 或 != 运 算 符 ， 因 此 不 要 尝试 使 用 它 向 范围 [b:e) 


写 入 数据 。 例 如， 车 b 和 e 是 raw_storage _iterator，iota(b,e,0) ( 见 40.6 节 ) 将 不 能 正常 
工作 。 不 要 随意 使 用 未 初始 化 内 存 ， 除 非 你 确实 必须 这 么 做 。 


34.7 建议 
[1] 当 你 需要 一 个 具有 constexpr 大 小 的 序列 时 ,使 用 array; 34.2.1 诈 。 
[2] 优先 选择 array 而 不 是 内 置 数组 ; 34.2.1 节 。 
[3] 当 你 需要 N 个 二 进 制 位 而 N 又 不 一 定 是 整数 类 型 的 位 宽 时 ,使 用 bitset ; 34.2.2 


[4] 
[5] 
[6] 
FE 守 | 
[8] 
[9|] 
[10] 











i 
避免 使 用 vector<bool>; 34.2.3 节 。 
当 使 用 pair 时 ， 考 虑 使 用 make_pair() 进行 类 型 推断 ; 34.2.4.1 节 。 
当 使 用 tuple 时 ， 考 虑 使 用 make_tuple() 进行 类 型 推断 ; 34.2.4.2 节 。 
使 用 unique_ptr 表示 互 斥 所 有 权 ; 34.3.1 节 。 
使 用 shared_ptr 表示 共享 所 有 权 ; 34.3.2 节 。 
尽量 不 使 用 weak_ptr; 34.3.3 节 。 
( 仅 ) 当 由 于 逻辑 上 或 性 能 上 的 原因 ， 常 用 的 new/delete 语义 不 能 满足 需求 时 才 
使 用 分 配器 ; 34.4 节 。 
优先 选择 有 特定 语义 的 资源 句柄 而 不 是 智能 指针 ; 34.5 节 。 
优先 选择 unique_ptr 而 不 是 shared_ptr; 34.5 节 。 
优先 选择 智能 指针 而 不 是 垃圾 收集 ; 34.5 节 。 
为 通用 资源 的 管理 提供 一 致 、 完 整 的 策略 ; 34.5 节 。 
在 大 量 使 用 指针 的 程序 中 处 理 泄漏 问题 ， 垃 圾 收集 是 非常 有 用 的 ; 34.5 节 。 
垃圾 收集 是 可 选 的 ; 34.5 节 。 
不 要 伪装 指针 (即使 你 不 使 用 垃圾 收集 ) 34.5 节 


] 如 果 你 使 用 垃圾 收集 ， 使 用 declare_no_pointers() 令 垃 圾 收集 器 忽略 不 可 能 包 


含 指针 的 数据 ; 见 34.5 节 。 


] 不 要 随意 使 用 未 初始 化 内 存 ， 除 非 你 确实 必须 这 么 做 ; 34.6 节 。 
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车 能 在 浪费 时 间 中 获得 乐趣 ， 就 不 是 浪费 时 间 。 
一 一 伯 特 兰 . 罗素 


e 引言 
e 时 间 
duration; time_point; 时 钟 ， 时 间 禁 取 
e 编译 时 有 理 数 运算 
类 型 函数 
类 型 萃取 ; 类 型 生成 器 
e 其 他 工具 
move() 和 forward(); swap(); 关系 运算 符 ; 比较 和 哈 希 type_info 
e 建议 


35.1 引言 
标准 库 提 供 了 很 多 应 用 广泛 的 “工具 组 件 "， 但 它们 很 难 归 到 某 类 主要 组 件 中 。 
35.2 ”时 间 


在 <chrono> 中 ,标准 库 提供 了 处 理 时 间 段 和 时 间 点 的 组 件 。 所 有 chrono 组 件 都 在 
( 子 ) 命名 空间 std::chrono 中 ， 因 此 我 们 必须 用 chrono:: 显 式 限定 名 字 或 使 用 using 指示 : 


using namespace std::chrono; 


我 们 通常 希望 对 某 事 计 时 或 做 某 些 依赖 于 时 间 的 事情 。 例 如 ， 标 准 库 互 斥 量 和 锁 提 供 了 让 
thread 等 待 一 段 时 间 (duration ) 或 等 待 到 给 定时 刻 (time_point) 的 选项 。 

如 果 你 希望 获得 当前 的 time_point， 可 以 对 3 种 时 钟 之 一 调用 now() : system_clock、 
steady_clock 和 high_resolution_clock。 例 如 : 


steady_clock::time_point t= steady_clock::now(); 

儿 .… 进行 一 些 操作 … 

steady_clock::duration d = steady_clock::now()-t; /| 操作 花费 了 d 个 时 间 单 位 
时 钟 返回 一 个 time_point， 一 个 duration 就 是 相同 时 钟 的 两 个 time_point 间 的 距离 。 照 例 ， 
如 果 你 对 细节 不 感 兴趣 ，auto 会 是 你 的 好 帮手 : 

auto t= steady_clock::now(); 

外 … 进行 一 些 操作 .… 

auto d = steady_clock::now()-t; /| 操作 花费 了 d 个 时 间 单 位 

cout << "something took " << duration_cast<milliseconds>(d).count() << "ms"; // 按 毫秒 打印 
时 间 组 件 的 设计 目的 之 一 是 支持 在 系统 深层 中 的 高 效 使 用 ; 它们 不 提供 社交 日 历 便利 维护 这 
类 组 件 。 实 际 上 ， 时 间 组 件 源 自 高 能 物理 的 迫切 需求 。 
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事实 已 证 明 “ 时 间 ” 并 不 像 我 们 通常 想象 的 那样 容易 处 理 。 例 如 ， 闽 秒 问 题 、 时 钟 不 准 
及 其 调整 问题 (可 能 导致 时 钟 报告 的 时 间 滞 后 )、 时 钟 不 同 精度 问题 ， 等 等 。 而 且 ， 处 理 短 
时 间 间 隔 (如 纳 秒 ) 的 组 件 本 身 不 能 花费 很 长 时 间 。 因 此 ，chrono 组 件 本 身 并 不 简单 ， 但 这 
些 组 件 的 很 多 应 用 却 可 以 非常 简单 。 

C 风格 时 间 工 具 将 在 43.6 节 中 介绍 。 


35.2.1 duration 


在 <chrono> 中 ,标准 库 提供 了 类 型 duration 来 表示 两 个 时 间 点 (time_point， 见 
35.2.2 节 ) 间 的 距离 : 


template<typename Rep, typename Period = ratio<1>> 
class duration { 
public: 

using rep = Rep; 

using period = Period; 

Mss 





} 
duration<Rep,Period>(iso:20.11.5) 
duration d {}; 默认 构造 函数 : d 成 为 {Rep{},Period{}}; constexpr 
duration d {r}; 用 rr 构造 ;了 必须 能 无 窗 化 地 转换 为 Rep; constexpr; 显 式 构 造 函 数 
duration d {d2}; 拷贝 构造 函数 : d 获得 与 d2 相同 的 值 ; d2 必须 能 无 窗 化 地 转换 为 Rep; constexpr 
d=d2 d 获得 与 d2 相同 的 值 ; d2 必须 能 表示 为 一 个 Rep 
r=d.count() r 是 d 中 的 时 钟 周期 数 ; constexpr 


我 们 可 以 定义 一 个 具有 指定 period 值 的 duration。 例 如 : 


duration<long long,milli> d1 {7}; /7 毫秒 
duration<double,pico> d2 {3.33}; /3.33 皮 秒 


duration<int,ratio<1,1>> d3 {}; /1 0 秒 
duration 的 period 保存 时 钟 周期 (clock tick) 数 : 
cout << d1.count() << \n ; /117 
cout << d2.count() << \n '; 113.33 
cout << d3.count() << "\n'; 110 
自然 ，count() 的 值 依赖 于 period: 
d2=d1; 
cout << d1.count() << \n’; 117 
cout << d2.count() << "\n'; /1 7e+009 


if (d1!=d2) cerr<<"insane!"; 


在 本 例 中 ，d1 和 d1 是 相等 的 ,但 报告 的 count() 值 却 非常 不 同 。 
我 们 必须 小 心 初始 化 时 截断 误差 或 精度 损失 (即使 未 使 用 {} 初始 化 方式 )。 例 如 : 
duration<int, milli> d {3}; /正确 
duration<int, milli> d {3.5}; 川 错误 : 3.5 转换 为 int 发 生 了 奉化 


duration<int, milli> ms {3}; 
duration<int, micro> us {ms)}; 川 正确 
duration<int, milli> ms2 {us}; 咱 错 误 : 我 们 可 能 丢失 很 多 微 秒 


标准 库 提供 了 一 些 duration 上 的 有 用 运算 : 
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duration<Rep,Period> ( 续 ) iso.20.11.5 ) 
『 是 一 个 Rep; 运算 是 按 不 同 表 示 的 common_type 进行 的 


++d ++d.r 

d++ duration{d.r++} 
==0 三 一 过 叉 

d= duration{d.r——} 
+d d 

-d duration{-d.r} 
d+=d2 d.r+=d2.r 
d-=d2 d.r-=d2.r 
d%=d2 d.r%=d2.r.count() 
d%=r d.r%=r 

d*=r d.r*=r 

d/=r d.r/=r 


period 是 一 个 单位 系统 ， 因 此 不 存在 与 普通 值 混合 进行 的 = 或 += 运算。 如 果 人 允许 这 种 运 


算 ， 就 像 允 许 将 5 个 未 知 国际 单位 与 一 个 米 制 长 度 值 相 加 一 样 。 考 虑 下 面 的 代码 : 
duration<long long,milli> d1{7}; /7 毫秒 
d1 += 5; 错误 
duration<int,ratio<1,1>> d2 {7}; 外 7 秒 
d2 = 5; /错误 
d2 += 5; 儿 错 误 


这 里 5 表示 什么 ? 5 秒 ? 5 毫秒 ? 还 是 其 他 什么 ?如 果 你 知道 其 含义 ， 应 显 式 说 明 。 例 如 : 


d1+= duration<long iong,milli>{5}; // 正确 : 毫秒 
d3 += decltype(d2){5}; // 正确 : 秒 


不 同 表示 方式 的 duration 的 混合 运算 是 允许 的 ， 只 要 这 种 组 合 有 意义 即 可 ( 见 35.2.4 节 ): 





duration<Rep,Period> ( 续 )(iso.20.11.5 ) 
r 是 一 个 Rep; 运算 是 按 不 同 表 示 的 common_type 进行 的 





d3=d+d2 constexpr 

d3=d-d2 constexpr 

d3=d%d2 constexpr 

d2=d%r d2=d%r.count(); constexpr 

d2=d * x x 是 一 个 duration 或 一 个 Rep; constexpr 
d2=r*d constexpr 

d2=d/x x 是 一 个 duration 或 一 个 Rep; constexpr 


标准 库 也 支持 表示 方式 相 容 的 duration 间 的 比较 和 显 式 类 型 转换 : 


duration<Rep,Period> ( 续 )(iso.20.11.5 ) 


d=zero() 将 0 赋予 Rep: d=duration{duration_values<rep>::zero()}; constexpr 

d=min() 最 小 的 Rep 值 (小 于 等 于 zero()): d=duration{duration_values<rep>::min()} ; 
constexpr 

d=max() 最 大 的 Rep 值 (大 于 等 于 zero()) : d=duration{duration_values<rep>::max()} ; 


constexpr 





( 续 ) 
duration<Rep,Period> ( 续 )(iso.20.11.5 ) 

d==d2 按 d 和 d2 的 common_type 进行 比较 ; constexpr 

dl=d2 . !(d==d2) 

d<d2 按 d 和 d2 的 common_type 进行 比较 ; constexpr 

d<=d2 !(d>d2) 

d>d2 按 d 和 d2 的 common_type 进行 比较 ; constexpr 

d>=d2 !(d<d2) 


d2=duration_cast<D>(d) ”将 d 转换 为 duration 类 型 D: 不 对 表示 方式 或 时 间 周期 进行 隐 式 转换 ;constexpr 


标准 库 提供 了 一 些 方便 的 别名 ,它们 使 用 来 自 <ratio> 的 国际 标准 单位 ( 见 35.3 节 ): 


using nanoseconds = duration<si64,nano>; 
using microseconds = duration<si55,micro>; 
using milliseconds = duration<si45,milli>; 
using seconds = duration<si35>; 

using minutes = duration<si29,ratio<60>>; 
using hours = duration<si23,ratio<3600>>; 


这 里 ，siN 表示 “一 个 由 实现 定义 的 至 少 N 位 的 带 符号 整数 类 型 ”。 
duration_cast 用 来 获得 一 个 度量 单位 已 知 的 duration。 例 如 : 


auto t1 = system_clock::now(); 
f(x); / 进行 一 些 操作 
auto t2 = system_ciock::now(); 


auto dms = duration_cast<milliseconds>(t2-t1); 
cout << "f(x) took " << dms.count() << " milliseconds\n"; 


auto ds = duration_cast<seconds>(t2-t1); 

cout << “f(x) took " << ds.count() << " seconds\n ; 
本 例 中 需要 类 型 转换 的 原因 是 我 们 正在 丢掉 信息 : 在 我 使 用 的 系统 上 ，system_clock 是 按 
nanoseconds 计时 的 。 

一 个 替代 方案 是 简单 地 (尝试 ) 构造 一 个 适合 的 duration: 


auto t1 = System_ciock::now(); 
f(x); /进行 一 些 操作 


auto t2 = System_clock::now(); 


cout << "f(x) took " << milliseconds(t2-t1).count() << " milliseconds\n"; /| 错误 : 截断 误差 
cout << "f(x) took " << microseconds(t2-t1).count() << " microseconds\n"; 
时 钟 的 精度 依赖 于 具体 实现 。 


35.2.2 time_point 


在 <chrono> 中 ,标准 库 提供 了 类 型 time_point， 用 来 表示 给 定 纪元 的 一 个 时 间 点 ， 用 
给 定 的 clock 度量 : 


template<typename Clock, typename Duration = typename Clock::duration> 
class time_point { 
public: 

using clock = Clock; 

using duration = Duration; 
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using rep = typename duration::rep; 
using period = typename duration::period; 
ll... 
}; 


一 个 纪元 (epoch) 就 是 由 给 定 clock 确 定 的 一 个 时 间 范 围 ， 用 duration 来 衡量 ， 从 
duration::zero() 开始 : 


time_point<Clock,Duration> (iso.20.11.6 ) 

默认 构造 函数 : 纪元 的 开始 : duration::zero() 

构造 函数 : 纪元 的 时 刻 d: time_point{}+d; 显 式 构造 函数 

构造 也 数 : tp 获得 与 tp2 相同 的 时 间 点 ; tp2 的 duration 类 型 必须 能 隐 式 转换 


time_point tp {}; 
time_point tp {d)}; 
time_point tp {tp2}; 


为 tp 的 duration 类 型 
d=tp.time_since_epoch() d 是 tp 保存 的 时 间 段 
tp=tp2 tp 获得 与 tp2 相 同 的 时 间 点 ; tp2 的 duration 类 型 必须 能 隐 式 转换 为 tp 的 
duration 类 型 
例如 : 
void test() 
{ 
time_point<steady_clock,milliseconds> tp1(milliseconds(100)); 
time_point<steady_clock,microseconds> tp2(microseconds(100*1000)); 
tp1=tp2; /错误 : 可 能 截断 
tp2=tp1; /正确 
if (tp1!=tp2) cerr << "Insane!"; 
} 


类 似 duration， 标 准 库 也 为 time_point 提供 了 有 用 的 算术 和 比较 运算 : 


time_point<Clock,Duration> ( 续 )(iso.20.11.5 ) 


tp+=d 前 移 tp: tp.d+=d 

tp-=d 后 移 tp: tp.d-=d 

tp2=tp+d tp2=time_point<Clock>{tp.time_since_epoch()+d} 
tp2=d+tp tp2=time_point<Clock>{d+tp.time_since_epoch()} 
tp2=tp-d tp2=time_point<Clock>{tp.time_since_epoch()-d} 
d=tp-tp2 d=durationt{tp.time_since_epoch()-tp2.time_since_epoch()} 
tp2=tp.min() tp2=time_point(duration::min()); 静态 的 ; constexpr 


tp2=tp.max() 


tp2=time_point(duration::max()); 静态 的 ; constexpr 


tp==tp2 tp.time_since_epoch()==tp2.time_since_epoch() 
tp!=tp2 !(tp==tp2) 

tp<tp2 tp.time_since_epoch()<tp2.time_since_epoch() 
tp<=tp2 i!(tp2<tp) 

tp>tp2 tp2<tp 

tp>=tp2 !(tp<tp2) 


tp2=time_point_cast<D>(tp) 


将 time_point tp 转换 为 time_point<C,D> : time_point<C,D>(duration_ 


cast<D>(t.time_since_epoch())) 
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例如 : 
void test2() 
{ 
auto tp = steady_clock::now(); 
auto d1 = time_point_cast<hours>(tp).time_since_epoch().count()/24; /从 纪元 开始 到 现在 的 天 数 ， 
using days = duration<long,ratio<24:60*60,1>>; 1 一 天 的 时 间 
auto d2 = time_point_cast<days>(tp).time_since_epoch().count(); /从 纪元 开始 到 现在 的 天 数 
if (d1!=d2) cout << "Impossiblel\n"; 
} 
不 访问 时 钟 的 time_point 操作 可 以 是 constexpr 的 ， 但 目前 的 C++ 实现 不 保证 这 一 点 。 
35.2.3 时钟 


time_point 和 duration 值 归根 结 底 是 从 硬件 时 钟 获得 的 。 在 <chrono> 中 ， 标 准 库 提供 
了 基本 的 时 钟 接口 。 类 system_clock 表示 “ 墙 上 时 间 ”， 是 从 系统 实时 时 钟 获取 的 : 


class system_clock { 
public: 
using rep =/* 实现 定义 的 带 符号 类 型 *; 
using period = /* 实现 定义 的 ratio<> */; 
using duration = chrono::duration<rep,period>; 
using time_point = chrono::time_point<system_clock>; 
i 
}; 


所 有 数据 和 函数 成 员 都 是 static 的 。 我 们 不 显 式 处 理 时 钟 对 象 ， 而 是 使 用 时 钟 类 型 ; 


时 钟 成 员 (iso.20.11.7 ) 


期 间隔 是 常量 吗 ? 静态 成 员 
tp=now() tp 为 调用 时 system_clock 的 time_point; 不 抛 出 异常 
t=to_time_t(tp) t 为 time_pointtp 的 time_t ( 见 43.6 节 ); 不 抛 出 异常 
tp=from_time_t(t) tp 为 time_tt 的 time_point tp; 不 抛 出 异常 
例如 : 
void test3() 
{ 


auto t1 = System_clock::now(); 

f(x); // 进 行 一 些 操作 

auto t2 = System_ciock::now(); 

cout << "f(x) took "<< duration_cast<milliseconds>(t2-t1).count() << " ms"; 


} 
系统 提供 了 3 个 命名 的 时 钟 : 


时 钟 类 型 (iso.20.11.7 ) 


system_clock 系统 实时 时 钟 ， 可 以 重 置 系统 时 钟 (向 前 或 向 后 跳 ) 来 匹配 内 部 时 钟 
steady_clock 时 间 稳 定 推 移 的 时 钟 ; 即 ， 时 间 不 会 回 退 且 时 钟 周 期 的 间隔 是 常量 


high_resolution_clock 一 个 系统 上 具有 最 短 时 间 增 量 的 时 钟 
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这 3 个 时 钟 可 能 只 是 相同 的 时 钟 的 别名 。 
我 们 可 以 像 下 面 这 样 确定 时 钟 的 基本 属性 : 


cout << “min " << system_clock::duration::min().count() 
<<",max" << system_clock::duration::max().count() 
<<","<< (treat_ as floating_ point<system_clock::duration>;:value ? "FP" : "integral"”) << "\n'; 


cout << (system_clock::is_steady?"steady\n": "not steady\n"); 


当 我 在 我 的 系统 上 运行 这 个 程序 时 ， 它 输出 : 


min -9223372036854775808, max 9223372036854775807, integral 
not steady 


不 同 的 系统 和 不 同 的 时 钟 可 能 给 出 不 同 的 结果 。 


35.2.4 ”时 间 茜 取 


chrono 组 件 的 实现 依赖 于 一 些 标准 库 组 件 ， 这 些 组 件 统称 为 时 间 革 取 (time trait)。 
duration 和 time_point 的 转换 规则 依赖 于 它们 的 表示 方式 是 浮 点 数 ( 从 而 舍 人 是 可 接受 
的 ) 还 是 整数 : 


template<typename Rep> 
struct treat_as_ floating_point : is_floating<Rep> {}; 


下 表 列 出 了 一 些 标准 值 : 


duration_values<Rep> (iso.20.11.4.2 ) 


r=zero() r=Rep(0); 静态 成 员 ; constexpr 
r=min() r=numeric_limits<Rep>::lowest(); 静态 成 员 ; constexpr 
r=max() r=numeric_limits<Rep>::max(); 静态 成 员 ; constexpr 


我 们 通过 计算 两 个 duration 的 最 大 公约 数 来 确定 它们 的 公共 类 型 ; 

template<typename Rep1, typename P1, typename Rep2, typename P2> 

struct common_type<duration<Rep1,P1>, duration<Rep2, P2>> { 

using type = duration<typename common_type<Rep1,Rep2>::type, GCD<P1,P2>> ; 

}; 

这 段 代 码 为 具有 最 大 可 能 时 钟 周 期 的 duration 定义 了 别名 type， 使 得 两 个 duration 实 
参 都 可 以 不 借助 除法 运算 直接 转换 为 它 。 这 意 common_type<R1,P1,R2,P2>::type, 能 保存 
来 自 于 duration<R1,P1> 和 duration<R2,P2> 的 任何 值 ， 且 没有 截断 误差 。 但 是 ， 浮 点 数 
duration 可 能 有 舍 信 误差: 


template<typename Clock, typename Duration1, typename Duration2> 
struct common_type<time_point<Clock, Duration1>, time_point<Clock, Duration2>> { 
using type = time_point<Clock, typename common_type<Duration1, Duration2>::type>; 


}; 
总 之 ， 为 了 获得 common_type， 两 个 time_point 必须 有 公共 的 时 钟 类 型 。 它 们 的 common_ 
type 就 是 一 个 time_point， 具 有 它们 的 duration 的 common_type。 
35.3 ”编译 时 有 理 数 运算 

<ratio> 中 定义 了 类 ratio， 提 供 了 编译 时 有 理 数 运 算 。 标 准 库 用 ratio 提供 时 间 段 和 时 
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间 点 ( 见 35.2 节 ) 的 编译 时 表示 : 


template<intmax_t N, intmax tD = 1> 
struct ratio { 
static constexpr intmax_t num; 
static constexpr intmax_t den; 


using type = ratio<num,den>; 


}; 
其 基本 思想 是 将 一 个 有 理 数 的 分 子 和 分 母 编码 为 ( 值 ) 模板 实 参 。 分 母 必须 非 零 。 


ratio 算术 运算 (iso.20.10.4 ) 





z=ratio_add<x,y> z.Num=x::num’*y::den+y::num’*x::den; z.den=x::den’*y::den 
z=ratio_subtract<x,y> z.num=x:num*y::den-y::num*x::den; z.den=x::den*y::den 
z=ratio_multiply<x,y> z.NUM=x::Nnum’*y::num; z.den=x::den*y::den 
z=ratio_divide<x,y> z.NumM=x::NnuM’*y::den; z.den=x::den’*y::num 
ratio_equal<x,y> x::NuUM==y::NUM && x::den==y::den 
ratio_not_equal<x,y> Iratio_equal<x,y>::value 
ratio_less<x,y> xnum*y::den < y::num’*x::den 
ratio_less_equal<x,y> Iratio_less_equal<y,x>::value 
ratio_not_less<x,y> Iratio_less<y,x>::value 
ratio_greater<x,y> ratio_less<y,x>::value 
ratio_greater_ equal<x,y> lratio_less<x,y>::value 

例如 : 


static_assert(ratio_add<ratio<1,3>, ratio<1,6>>::num == 1, "problem: 1/3+1/6 != 1/2"); 
static_assert(ratio add<ratio<1,3>, ratio<1,6>>::den == 2, "problem: 1/3+1/6 != 1/2"); 
static_assert(ratio_multiply<ratio<1,3>, ratio<3,2>>::num == 1, "problem: 1/3*3/2 != 1/2"); 
static_assert(ratio_multiply<ratio<1,3>, ratio<3,2>>::den == 2, "problem: 1/3*3/2 != 1/2"); 


显然 ， 这 并 不 是 一 种 表达 有 理 数 和 算术 运算 的 简便 方法 。 在 <chrono> 中 ， 为 时 间 定 义 了 更 
符合 习惯 的 有 理 数 算术 运算 (例如 + 和 *， 见 35.2 节 )。 类 似 地 ， 为 了 表达 单位 值 ， 标 准 库 
提供 了 常用 的 国际 单位 制 量 级 : 


using yocto =ratio<1,1000000000000000000000000>; 咱 有 条 件 地 支持 
using zepto =ratio<1,1000000000000000000000>;  // 有 条 件 地 支持 


using atto = ratio<1,1000000000000000000>; 
using femto = ratio<1,1000000000000000>; 
using pico = ratio<1,1000000000000>; 


using nano = ratio<1,1000000000>; 
using micro =ratio<1,1000000>; 


using milli = ratio<1,1000>; 

using centi = ratio<1,100>; 

using deci = ratio<1,10>; 

using deca = ratio<10,1>; 

Using hecto = ratio<100,1>; 

using kilo = ratio<1000,1>; 

using mega =ratio<1000000,1>; 

using giga = ratio<1000000000,1>; 

using tera = ratio<1000000000000,1>; 

using peta = ratio<1000000000000000,1>; 
using exa = ratio<1000000000000000000,1>; 
using zetta ”=ratio<1000000000000000000000,1>;  // 有 条 件 地 支持 


using yotta = ratio<1000000000000000000000000,1>; 儿 有 条 件 地 支持 
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使 用 示例 见 35.2.1 节 。 


35.4 ”类 型 函数 

在 <type_traits> 中 ,标准 库 提供 了 类 型 函数 ( 见 28.2 节 )， 用 来 确定 类 型 的 属性 (类 型 
萃取 ， 见 35.4.1 节 ) 以 及 从 已 有 类 型 生成 新 类 型 (类 型 生成 器 ; 见 35.4.2 节 )。 这 些 类 型 函 
数 主要 用 于 在 编译 时 支持 简单 和 不 那么 简单 的 元 编程 。 


35.4.1 类 型 芋 取 


在 <type_traits> 中 ,标准 库 提供 了 多 种 类 型 函数 ， 允 许 程序 员 确 定 一 个 类 型 或 一 对 类 
型 的 属性 。 它 们 的 名 字 大 多 是 自 解释 的 。 主 类 型 谓词 (primary type predicate) 检测 类 型 的 基 
本 属性 : 





主 类 型 谓词 (iso.20.9.4.1) 





is_void<X> X 是 void ? 

is_integral<X> X 是 一 个 整数 类 型 ? 

is_floating_point<X> X 是 一 个 浮 点 数 类 型 ? 

is_array<X> X 是 一 个 内 置 数组 ? 

is_pointer<X> X 是 一 个 指针 (不 包括 指向 成 员 的 指针 ) ? 
is_lvalue_reference<X> X 是 一 个 左 值 引用 ? 

is_rvalue_reference<X> X 是 一 个 右 值 引用 ? 
is_member_object_pointer<X> X 是 一 个 指向 非 static 数据 成 员 的 指针 ? 
is_member_function_pointer<X> X 是 一 个 指向 非 static 成 员 函 数 的 指针 ? 
is_enum<X> X 是 一 个 enum (普通 enum 或 class enum) ? 
is_union<X> X 是 一 个 union ? 

is_class<X> X 是 一 个 class (包括 struct， 但 不 包括 enum) ? 
is_function<X> X 是 一 个 函数 ? 


类 型 莹 取 返 回 一 个 布尔 值 。 为 了 访问 此 值 ， 可 使 用 后 缀 ::value。 例 如 : 


template<typename T> 

void f(T& a) 

{ 
static_assert(std::is floating_point<T>::value,"FP type expected"); 
Ws 

} 


如 果 你 厌烦 了 ::value 符号 ， 可 以 定义 一 个 constexpr 函数 ( 见 28.2.2 节 ): 


template<typename T> 
constexpr bool ls_floating_point<T>() 
{ 
return std::is_ floating_point<T>::value; 


} 


template<typename T> 

void f(T& a) 

{ 
static_assert(ls_floating_point<T>(),"FP type expected"); 
儿 
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理想 情况 下 ， 应 对 所 有 标准 库 类 型 茜 取 提供 这 种 函数 。 








某 些 类 型 函数 查询 基本 属性 的 组 合 : 
组 合 类 型 谓词 (iso.20.9.4.2 ) 

is_reference<X> X 是 一 个 引用 ( 左 值 或 右 值 引用 ) ? 
is_arithmetic<X> X 是 一 个 算术 类 型 ( 整 型 或 浮 点 型 ; 见 6.2.1 节 ) ? 
is_fundamental<X> X 是 一 个 基本 类 型 ( 见 6.2.1 节 )? 
is_object<X> X 是 一 个 对 象 类 型 (而 非 函 数 ) ? 
is_scalar<X> X 是 一 个 标量 类 型 (而 非 类 或 函数 ) ? 
is_compound<X> X 是 一 个 复合 类 型 (lis_fundamental<X>)? 
is_member_pointer<X> X 是 一 个 指向 非 static 数据 或 函数 成 员 的 指针 ? 


这 些 复合 类 型 谓词 (composite type predicate) 仅仅 是 为 了 提供 方便 的 符号 表示 。 例 如 ， 当 XX 
为 左 值 引用 或 右 值 引用 时 is_reference<X> 为 真 。 

与 主 类 型 谓词 类 似 ， 类 型 属性 谓词 ( type property predicate) 提供 对 类 型 基本 属性 的 
检测 : 


类 型 属性 谓词 (iso.20.9.4.1 ) 











is_const<X> X 是 一 个 const ? 
is_volatile<X> X 是 一 个 volatile ( 见 41.4 节 ) ? 
is_trivial<X> X 是 一 个 平凡 类 型 ( 见 8.2.6 节 ) ? 
is_trivially_copyable<X> X 可 以 作为 一 个 简单 的 位 集合 被 拷贝 、 移 动 以 及 销毁 ( 见 8.2.6 节 ) ? 
is_standard_layout<X> X 是 一 个 标准 布局 类 型 ( 见 8.2.6 节 ) ? 
is_pod<X> X 是 一 个 POD ( 见 8.2.6 节 )? 
is_literal_type<X> X 有 constexpr 构造 水 数 ( 见 10.4.3 节 ) ? 
is_empty<X> X 有 需要 在 对 象 中 分 配 空间 的 成 员 ? 
is_polymorphic<X> X 有 虚 函 数 ? 
is_abstract<X> X 有 纯 虚 函数 ? 
is_signed<X> X 是 一 个 算术 类 型 且 是 带 符号 的 ? 
is_unsigned<X> X 是 一 个 算术 类 型 且 是 无 符号 的 ? 
is_constructible<X,args> X 可 以 用 args 构造 ? 
is_default_constructible<X> X 可 以 用 人 构造? 
is_copy_constructible<X> X 可 以 用 一 个 X& 构造 ? 
is_move_constructible<X> X 可 以 用 一 个 X&& 构造 ? 
is_assignable<X,Y> 可 以 将 一 个 Y 赋予 一 个 X? 
is_copy_assignable<X> 可 以 将 一 个 X& 赋予 一 个 X? 
is_move_assignable<X> 可 以 将 一 个 X&& 赋予 一 个 X? 
is_destructible<X> 一 个 X 可 以 被 销毁 〈 即 ，”X() 未 被 删除 ) ? 
例如 : 
template<typename T> 
class Cont { 


T* elem; /将 元 素 保存 在 elem 指向 的 数组 中 
int sz; ”//sz 个 元 素 
I... 
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Cont(const Cont& a) /拷贝 构造 函数 
:sz(a.sz), elem(new T[a.elem]) 


{ 
static_assert(ls_copy_constructabie<T>(),"Cont::Cont(): no copy"); 
if (ls_trivially_copyable<T>()) 
memcpy(elem,a.elem,sz*sizeof(T)); /memcopy 优化 
else 
uninitialized_copy(a.begin(),a.end(),elem); /使 用 拷贝 构造 函数 
} 


} 
此 优化 可 能 是 不 必要 的 ， 因 为 uninitialized_copy() 的 实现 很 可 能 已 经 采用 了 这 种 优化 。 
对 一 个 空 类 ， 它 没有 虚 函 数 、 没 有 虚 基 类 日 没有 满足 lis_empty<Base>::value 的 基 类 。 
类 型 属性 谓词 所 做 的 访问 检查 都 不 依赖 于 它们 的 使 用 位 置 。 相 反 ， 即 使 用 在 成 员 和 友 元 
之 外 ， 它 们 也 会 一 致 地 给 出 你 所 期 望 的 结果 。 例 如 : 


class X{ 
public: 
void inside(); 
private: 
X& operator=(const X&); 
Xx0; 
上 
void X::inside() 
{ 
cout << "inside =: " << is_copy_assignable<X>::value << "\n'; 
cout << "inside  :" << is _ destructible<X>::value << "\n'; 
} 
void outside() 
cout << "outside =: ”<< is_copy_assignable<X>::value << \n ; 
cout << "outside  : ”<< is_destructible<X>::value << "\n’; 
} 


inside() 和 outside() 都 会 输出 00 报告 X 既 不 能 被 销毁 也 不 能 拷贝 赋值 。 而 且 ， 如 果 你 希望 
消除 一 个 操作 ， 应 该 用 =delete ( 见 17.6.4 节 ) 而 不 是 依赖 private。 


类 型 属性 谓词 ( 续 )(iso.20.9.4.3 ) 
is_trivially_constructible<X,args> 可 以 仅 使 用 平凡 操作 从 args 构造 X 吗 ? 
is_trivially_default_constructible<X> 
is_trivially_copy_constructible<X> 
is_trivially_move_constructible<X> 
is_trivially_assignable<X,Y> 见 8.2.6 节 
is_trivially_copy_assignable<X> 
is_trivially_move_assignable<X> 
is_trivially_destructible<X> 


例如 ， 考 虑 我 们 如 何 优化 一 个 容器 类 型 的 析 构 函数 : 
template<class T> 
Cont::Cont() /1 一 个 容器 Cont 的 析 构 函数 
{ 
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if (lls_trivially_destructible<T>()) 
for (T* p = elem; pl=p+sz; ++p) 
p-> T(); 





类 型 属性 谓词 ( 续 )(iso.20.9.4.3 ) 
is_nothrow_constructible<X,args> 可 以 仅 使 用 noexcept 操作 从 args 构造 X 吗 ? 
is_nothrow_default_constructible<X> 
is_nothrow_copy_constructible<X> 
is_nothrow_move_constructible<X> 
is_nothrow_assignable<X,Y> 
is_nothrow_copy_assignable<X> 
is_nothrow_move_assignable<X> 
is_nothrow_destructible<X> 
has_virtual_destructor<X> X 有 纯 虚 函数 吗 ? 


与 sizeof(T) 类 似 ， 属 性 查询 返回 一 个 与 类 型 实 参 相关 的 数值 : 


类 型 属性 查询 (iso.20.9.5 ) 








n=alignment_of<X> n=alignof(X) 
n=rank<X> 若 X 是 一 个 数组 ，n 是 维 数 ; 否则 n== 
n=extent<X,N> 若 X 是 一 个 数组 , n 是 第 N 维 的 元 素数 ; 否则 n== 
n=extent<X> n=extent<X,0> 
例如 : 
template<typename T> 
void f(T a) 
{ 
static_assert(ls_array<T>(), "f(): not an array"); 
constexpr int dn {Extent<a,2>()}; /第 2 维 (从 0 开始 ) 的 元 素数 
Ws 
} 


这 里 ,我 再 次 用 类 型 函数 的 constexpr 版 本 返回 数值 ( 见 28.2.2 节 )。 
类 型 关系 (type relation) 是 两 个 类 型 上 的 谓词 : 


类 型 关系 (iso.20.9.6 ) 


is_same<X,Y> X 和 Y 是 相同 类 型 ? 
is_base_of<X,Y> X 是 Y 的 基 类 ? 
is_convertible<X,Y> 一 个 X 可 以 隐 式 转换 为 一 个 Y? 


例如 : 


template<typename T> 

void draw(T t) 

{ 
static_assert(ls_same<Shape*,T>() ||!s_base_of<Shape,Remove pointer<T>>(), "); 
t->draw(); 
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35.4.2 ”类 型 生成 器 
在 <type_traits> 中 ， 标 准 库 提供 了 从 一 个 给 定 类 型 实 参 生 成 男 一 个 类 型 的 类 型 函数 。 


const 和 volatile 修改 (iso.20.9.7.1 ) 


remove_const<X> 类 似 X， 但 顶层 const 被 去 掉 的 类 型 

remove_volatile<X> 类 似 X， 但 顶层 volatile 被 去 掉 的 类 型 

remove_cv<X> 类 似 X， 但 任何 顶层 const 或 volatile 都 被 去 掉 的 类 型 

add_const<X> 若 X 是 一 个 引用 、 函 数 或 const， 则 得 到 X; 否则 得 到 const X 
add_volatile<X> 若 X 是 一 个 引用 、 函 数 或 volatile ， 则 得 到 X; 否则 得 到 volatile X 

struct add_cv<X> 添加 const 和 volatile: add_const<typename add_volatile<T>::type>::type 


一 个 类 型 转换 器 返回 一 个 类 型 。 为 了 访问 这 个 类 型 ， 可 以 使 用 后 缀 ::type。 例 如 : 


template<typename K, typename V> 
class My_map{ 


{ 
pair<typename add_const<K>::type,V> default_node; 
| 

}; 


如 果 你 厌倦 了 ::type， 可 以 定义 一 个 类 型 别名 ( 见 28.2.1 节 ): 


template<typename T> 
using Add_const = typename add_const<T>::type; 


template<typename K, typename V> 
class My_map{ 
{ 


pair<Add_const<K>,V> default_node; 
本 


}; 
理想 情况 是 有 一 个 支撑 库 ， 系 统 地 为 标准 库 类 型 转换 器 提供 这 种 别名 。 


引用 修改 (iso.20.9.7.2 和 iso.20.9.7.6 ) 


remove_reference<X> 若 X 是 一 个 引用 类 型 ， 则 得 到 被 引用 的 类 型 ; 否则 得 到 X 
add lvalue _reference<X> 若 X 是 一 个 右 值 引用 Y&&， 则 得 到 Y&; 否则 得 到 X& 
add_rvalue_reference<X> 若 X 是 一 个 引用 ， 则 得 到 X; 否则 得 到 X& ( 见 7.7.3 节 ) 
decay<X> 将 函数 实 参 类 型 X 转换 为 可 按 值 传递 的 类 型 


函数 decay 处 理 数 组 退化 和 引用 的 解 引用 。 
在 编写 既 接受 引用 实 参 也 接受 非 引用 实 参 的 模板 时 ， 添 加 和 删除 引用 的 类 型 函数 非常 重 
要 。 例如 : 


template<typename T> 


void f(T V) 
{ 
Remove_reference<T> x=vV; /lv 的 拷贝 
Ty=v; 中 可 能 是 v 的 拷贝 ; 也 可 能 是 v 的 引用 
++x; 儿 递 增 局 部 变量 
++y; 


hs 
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在 本 例 中 ，x 的 确 是 v 的 一 个 拷贝 ， 但 若 T 是 一 个 引用 类 型 ，y 就 是 v 的 一 个 引用 : 


void user() 
{ 

int val = 7; 

f(val); /调用 f<int&>(): fl0) 中 的 ++y 会 递增 val 

f(7); /调用 fint>0: f0 中 的 ++ty 会 递增 一 个 局 部 拷贝 
} 


但 在 两 个 调用 中 ，++x 都 是 递增 一 个 局 部 拷贝 。 


符号 修改 (iso.20.9.7.3 ) 
”make_signed<X> ”去 除 任何 ( 显 式 或 隐 式 的 ) unsigned 修饰 符 并 添加 signed ; X 必须 是 一 个 整数 类 型 
(bool 或 枚 举 除 外 ) 
make_unsigned<X> 去 除 任何 ( 显 式 或 隐 式 的 ) signed 修饰 符 并 添加 unsigned ; X 必须 是 一 个 整数 类 型 
(bool 或 枚 举 除 外 ) 


对 内 置 数 组 ， 我 们 有 时 希望 获得 元 素 类 型 或 去 除 一 个 维度 : 
数组 修改 (iso.20.9.7.4 ) 


remove_extent<X> 若 X 是 一 个 数组 类 型 ， 获 得 元 素 类 型 ; 否则 获得 X 
remove_all_extents<X> 若 X 是 一 个 数组 类 型 ， 获 得 基 类 型 (在 去 除 所 有 数组 修饰 符 之 后 );， 否则 获得 X 





例如 : 
int a[10][20]; 
Remove_extent<decitype(a)> a10; // 一 个 array[10] 
Remove_ all extents<decltype(a)> i; 外 一 个 int 


我 们 可 以 创建 一 个 指向 任意 类 型 的 指针 ， 或 查询 指针 指向 的 类 型 : 


指针 修改 (iso.20.9.7.5 ) 


remove_pointer<X> 若 X 是 一 个 指针 类 型 ， 获 得 它 指向 的 类 型 ; 否则 获得 X 
add_pointer<X> remove_reference<X>::type”* 
例如 : 
template<typename T> 
void f(T x) 
Add_pointer<T> p = new Remove_reference<T>{}; 
T* p = new Tf}; 中 若 T 是 一 个 引用 ， 则 不 能 正确 工作 
人 
} 


当 在 系统 底层 处 理 内 存 时 ， 我 们 有 时 必须 考虑 对 齐 问题 ( 见 6.2.9 节 ): 


对 齐 (iso.20.9.7.6 ) 


aligned_storage<n,a> 得 到 一 个 大 小 至 少 为 n 的 POD 类 型 ， 按 a 的 因子 对 齐 
aligned_storage<n> aligned_storage<n,def>， 其 中 def 是 满足 sizeof(T)<=n 的 任意 对 象 类 型 T 的 
所 需 最 大 对 齐 


aligned_union<n,X...> 大 小 至 少 为 n 的 POD 类型， 能 保存 一 个 成 员 类 型 为 X 的 union 
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C++ 标准 提 及 aligned_storage 可 能 实现 如 下 : 


template<std::size_t N, std::size t A> 
struct aligned_storage { 

using type = struct { alignas(A) unsigned char data[N]; }; IN 个 对 齐 到 A 的 char ( 见 6.2.9 节 ) 
}; 


最 后 一 组 类 型 函数 用 于 类 型 选择 、 计 算 公 共 类 型 ， 等 等 ， 可 以 说 是 最 有 用 的 一 类 : 


enable_if<b,X> 若 b==true 得 到 X ; 否则 将 不 会 有 成 员 ::type， 从 而 在 大 多 数 情况 下 导致 代入 失 
败 ( 见 23.5.3.2 节 ) 

enable_if<b> enable_if<b,void> 

conditional<b,T,F> 若 b==true 得 到 X; 否则 得 到 F 

common_type<X> 参数 包 X 中 所 有 类 型 的 公共 类 型 ; 如 果 两 个 类 型 可 以 用 作 ?3: 表达 式 的 真 和 假 类 
型 ， 则 它们 是 共同 的 

underlying_type<X> 得 到 X 的 底层 类 型 ( 见 8.4 节 ); X 必须 是 一 个 枚 举 

result_of<FX> 得 到 F(X) 的 结果 类 型 ，FX 必须 是 一 个 类 型 F(X)， 其 中 F 用 实 参 列表 X 调用 


enable_if 和 conditional 的 示例 见 28.3.1.1 节 和 28.4 节 。 

对 于 施用 于 多 个 类 型 的 操作 (如 两 个 相关 但 不 同 的 类 型 的 加 法 操作 )， 查 询 公 共 类 型 ( 结 
果 类 型 ) 通常 是 很 有 用 的 。 类 型 函数 common_type 可 以 查询 这 种 公共 类 型 。 一 个 类 型 ( 显 
然 ) 是 它 自己 的 公共 类 型 : 


template<typename ...T> 
struct common_type; 


template<typename T> 
struct common_type<T> { 
using type = T; 
}; 
两 个 类 型 的 公共 类 型 就 是 ?: 的 规则 ( 见 11.1.3 节 ) 所 能 给 我 们 的 结果 : 
template<typename T, typename U> 
struct common_type<T, U>{ 
using type = decltype(true ? declval<T>() : declval<U>()); 
}; 
类 型 函数 decltype<T>() 返回 类 型 为 T 的 变量 (不 求 值 ) 的 类 型 。 
N 个 类 型 的 公共 类 型 可 以 通过 递归 地 应 用 N==1 和 N==2 的 规则 来 得 到 : 
template<typename T, typename U, typename... V> 
struct common_type<T, U, V...> { 


using type = typename common_type<typename common_type<T, U>::type, V...>::type; 


» 


template<typename T, typename U> 
using Common_type = typename common_type<T,U>::type; 


Common_type<int,double> x1; /xl 是 一 个 a double 
Common_type<int,string> x2; 儿 错误 : 没有 公共 类 型 
Common_type<int,short,long,long long> x3; /1x3 是 一 个 long long 
Common_type<Shape:*,Circle*> x4; /1 x4 是 一 个 Shape* 


Common_type<void*,double*,Shape*> x5; jl xs 是 一 个 void* 
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Result_of 用 来 抽取 一 个 可 调用 对 象 的 结果 类 型 : 


int ff(int) { return 2; } /函数 
typedef bool (*PF)(int); 儿 函数 指针 
struct Fct { /函数 对 象 


double operator()(string); 
string operator()(int,int); 


》 


auto fx = [](char ch) { return tolower(ch); }; //lambda 


Result_of<decitype(&ff)()> r1 = 7; Mrl 是 一 个 int 
Result_of<PF(int)> r2 = true; /rz2 是 一 个 bool 
Result_of<Fct(string)> r3 = 9.9; /ll/r3 是 一 个 double 
Result_of<Fct(int,int)> r4 = "Hero"; /中 r4 是 一 个 string 


Result_of<decltype(fx)(char)> r5 = 'a'; l/r5 是 一 个 char 


注意 ，result_of 能 区 分 Fct::operator()() 的 两 个 版 本 。 
很 奇怪 的 是 ， 它 不 能 区 分 非 成 员 函 数 的 不 同 版 本 。 例 如 : 


int f(); | 函数 
string f(int); 
Result_of<decltype(&f)()> r1 = 7; // 错误 : 不 能 进行 函数 指针 的 重 载 解析 


不 幸 的 是 ， 我 们 不 能 做 函数 指针 的 重 载 解析 ， 但 为 什么 这 样 迁 回 地 使 用 Result_of 呢 ， 是 否 
可 以 这 样 : 


Result_of<ff> r1 = 7; 儿 错误 : 没有 实 参 说 明 且 任 是 一 个 函数 而 不 是 一 个 类 型 
Result_of<ff()> r1 = 7; 儿 错误: result of 的 实 参 必须 是 一 个 类 型 
Result_of<decitype(f)()> r2 = 7; /错误 : decltype( 是 一 个 函数 类 型 而 不 是 一 个 函数 指针 类 型 
Result_of<decltype(f)*()> r3 = 7; // 正确 : r3 是 一 个 int 


自然 地 ，Result_of 通常 用 于 模板 中 我 们 不 能 容易 地 从 程序 上 下 文 获取 答案 的 地 方 。 例 如 : 


template<typename F, typename A> 
auto temp(F f, A a) -> Result_of<F(A)> 


{ 
从 
} 
void f4() 
{ 
temp(ff,1); 
temp(fx,"a"); 
temp(Fct(),"Ulysses"); 
} 


注意 ， 在 调用 中 函数 代 被 转换 为 一 个 函数 指针 ， 这 样 result_of 对 函数 指针 的 依赖 就 不 会 像 
初 看 时 那么 奇怪 了 。 
declval() (iso.20.2.4 ) 
declval<T>() 返回 T 的 右 值 : typename add_r value_reference<T>::type ; 永远 也 不 要 使 用 declval 
的 返回 值 


在 标准 库 中 ， 类 型 函数 declval() 有 点 不 寻常 ， 因 为 它 实 际 上 是 一 个 函数 (不 需要 用 户 去 封 





装 它 )。 我 们 不 应 使 用 它 的 返回 值 。declval<X> 的 用 途 是 作为 一 个 类 型 ， 用 在 需要 X 类 型 变 
量 的 类 型 的 地 方 。 例 如 : 

template<typename T, size_t N> 

void array<T,N> swap(array& y) noexcept(noexcept(swap(declval<T&>(), declval<T&>()))) 


{ 


for (int i=0; i<a.size(); ++i) 


swap((*this)fi],afi]); 
} 
请 参阅 common_type 的 定义 。 
35.5 ”其 他 工具 


本 节 介 绍 的 工具 数量 少 ， 但 重要 性 并 不 低 ， 它 们 只 是 不 能 归 人 大 类 而 已 。 





35.5.1 move() 和 forward() 
在 <utility> 中 ， 标 准 库 提供 了 一 些 最 有 用 的 小 函数 : 


其 他 转换 (iso.20.9.7.6 ) 





x2=forward(x) x2 是 一 个 右 值 ; x 不 能 是 左 值 ; 不 抛 出 异常 

x2=move(x) x2 是 一 个 右 值 ; 不 抛 出 异常 

x2=move_if_noexcept(x) 若 x 可 移动 ，x2=move(x); 否则 x2=x; 不 抛 出 异常 
move() 进行 简单 的 右 值 转换 : 


template<typename T> 
Remove_reference<T>&& move(T&& t) noexcept 


{ 


} 
我 的 观点 ，move() 应 该 命名 为 rvalue() 才 对 ， 因 为 它 并 没有 移动 任何 东西 ， 而 是 从 实 参 生 
成 一 个 右 值 ， 从 而 所 指向 的 对 象 可 以 移动 。 

我 们 用 move() 告知 编译 器 : 此 对 象 在 上 下 文中 不 再 被 使 用 ， 因 此 其 值 可 被 移动 ， 留 下 
一 个 空 对 象 。 最 简单 的 例子 是 swap() 的 实现 ( 见 35.5.2 )。 

forward() 从 右 值 生 成 一 个 右 值 : 


template<typename T> 
T&& forward(Remove_reference<T>& t) noexcept 


{ 
} 


return static_cast<Remove_reference<T>&&>(t); 


return static_cast<T&&>(t); 


template<typename T> 
T&& forward(Remove_reference<T>&& t) noexcept; 


{ 
static_assert(!ls_lvalue_reference<T>,"forward of lvalue"); 
return static_cast<T&&>(t); 


} 
这 对 forward() 函数 总 是 会 一 起 提供 ， 两 者 间 的 选择 是 通过 重 载 解析 实现 的 。 在 本 例 中 ， 任 
何 左 值 都 会 由 第 一 个 版 本 处 理 ， 而 任何 右 值 都 会 转向 第 二 个 版 本 。 例 如 : 
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inti= 7; 
forward(i); 咱 调 用 第 一 个 版 本 
forward(7); /| 调用 第 二 个 版 本 


新 言语 句 是 为 了 防止 聪明 过 头 的 程序 员 用 一 个 显 式 模板 实 参 和 一 个 左 值 调 用 第 二 个 版 本 。 

forward() 的 典型 用 法 是 将 一 个 实 参 从 一 个 函数 “完美 转发 ”到 另 一 个 函数 ( 见 23.5.2 
节 和 28.6.3 节 )。 标 准 库 make_shared<T>(x) ( 见 34.3.2 节 ) 是 一 个 很 好 的 例子 。 

当 希 望 用 一 个 移动 操作 “窃取 ”一 个 对 象 的 表示 形式 时 ， 使 用 move() ; 当 希 望 转发 一 
个 对 象 时 ， 使 用 forward()。 因 此 ，forward(x) 总 是 安全 的 ， 而 move(x) 标记 x 将 被 销毁 ， 
因此 要 小 心 使 用 。 调 用 move(x) 之 后 x 唯一 安全 的 用 法 就 是 析 构 或 是 赋值 的 目的 。 显 然 ， 
一 个 特定 类 型 可 能 提供 更 多 的 保证 ， 理 想 情况 下 类 的 不 变 式 保 持 不 变 。 但 是 ， 除 非 你 确切 知 
道 这 类 保证 ， 否 则 不 要 依赖 它们 。 


35.5.2 swap!() 
在 <utility> 中 ， 标 准 库 提供 了 一 个 通用 的 swap() 和 一 个 针对 内 置 数 组 的 特例 化 版 本 : 


其 他 转换 (iso.20.2.2 ) 





swap(x,y) 交换 x 和 y 的 值 ,x 和 y 按 非 const 引用 的 方式 传递 ; 若 x 和 y 的 拷贝 操作 不 抛 出 异 
常 ， 则 swap() 也 不 抛 出 异 党 
swap(a1n,a2n) a1n 和 a2n 按 数 组 引用 的 方式 传递 : T(&)[N] ; 若 *a1n 和 *a2n 的 拷贝 操作 不 抛 出 异 


常 ， 则 swap() 也 不 抛 出 异常 


下 面 给 出 swap() 的 一 个 相对 明显 的 实现 : 


template<typename T> 
void swap(T& a, T& b) noexcept(ls_nothrow_move_constructible<T>() 
&& ls_nothrow_move_assignable<T>()) 


{ 
Ttmp {move(a)}; 
a= move(b); 
b = move(tmp); 
} 


这 意味 着 swap() 不 能 用 来 交换 右 值 : 


vector<int> v1 {1,2,3,4}; 
swap(v,vecor<int>{}); 儿 错 误 : 第 二 个 实 参 是 一 个 右 值 
v.clear(); 儿 更 清晰 《不 那么 史 涩 ) 
35.5.3 ”关系 运算 符 
在 <utility> 中 ， 标 准 库 提 供 了 任意 类 型 的 关系 运算 符 ， 它 们 定义 在 子 命名 空间 rel_ops 中 : 


std::rel_ops 的 关系 运算 符 (iso.20.2.1 ) 





x!=y !(x==y) 
x>y y<x 
X<=y !(y<x) 
x>=y !(x<y) 


而 


序 员 需 确保 运算 x==y 和 x<y 能 正常 工作 。 
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例如 : 


struct Val { 
double d; 
bool operator==(Val v) const { return v.d==d; } 


上 
void my_algo(vector<Val>& vv) 
using namespace std::rel_ops; 


for (int i=0; i<ww.size(); ++i) 
if (0>ww[i]) ww[i]=abs(ww[i]); / 正确: 使 用 来 自 rel ops 的 > 
} 
使 用 rel_ops 又 不 污染 命名 空间 是 很 困难 的 。 特 别 是 : 


namespace Mine { 
struct Val { 
double d; 
bool operator==(Val v) const { return v.d==d; } 


}》 


using namespace std::rel_ops; 


} 


这 样 ， 来自 rel_ops 的 通用 模板 就 会 因 实 参 依赖 查找 ( 见 14.2.4 节 ) 暴露 出 来 ， 并 应 用 于 可 
能 并 不 适合 的 类 型 。 一 种 更 安全 的 方法 是 在 局 部 作用 域 中 放置 using 指令 。 


35.5.4 比较 和 哈 希 type_info 


在 <typeindex> 中 ， 标 准 库 提 供 了 比较 和 哈 希 type_index 的 组 件 。 一 个 type_index 是 
从 一 个 type_info ( 见 22.5 节 ) 创建 的 ， 专门 用 于 这 种 比较 和 哈 希 : 


type_index 操作 (iso.20.13 ) 


type_index ti {tinf}; ti 表示 type_info tinf; 不 抛 出 异常 

ti==ti2 ti 和 ti2 表示 相同 的 type_info: “ti.tip==*ti2.tip ); 不 抛 出 异常 
til=ti2 !(ti==ti2); 不 抛 出 异常 

ti<ti2 ti.tip->before(ti2.tip); 不 抛 出 异常 

ti<=ti2 lti2.tip->before(ti.tip); 不 抛 出 异常 

ti>ti2 ti2.tip->before(ti.tip); 不 抛 出 异常 

ti>=ti2 lti.tip->before(ti2.tip); 不 抛 出 异常 

n=ti.hash_code() n=ti.tip->hash_code() 

p=name!() p= ti.tip->name() 

hash<type_index> hash 的 特例 化 版 本 ( 见 31.4.3.4 节 ) 


例如 : 


unordered_map<type_index,type_info*> types; 
Wisas 
types[type_index{something}] = &typeid(something); 
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35.6 建议 


[1] 用 <chrono> 组 件 ， 如 steady_clock、duration 和 time_point 进 行 计时 ; 35.2 节 。 
[2] 优先 使 用 <clock> 组 件 而 不 是 <ctime> 组 件 ; 35.2 节 。 

[3] 用 duration_cast 获得 已 知 单位 的 时 间 段 ; 35.2.1 节 。 

[4] 用 system_clock::now() 获得 当前 时 间 ; 35.2.3 节 。 

[5] 可 以 在 编译 时 查询 类 型 的 属性 ; 35.4.1 节 。 

[6] 仅 当 obj 的 值 不 再 使 用 时 使 用 move(obj); 35.5.1 节 。 

[7] 用 forward() 进行 转发 ; 35.5.1 节 。 
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优先 选择 标准 而 非 另类 。 
一 一 斯 特 伦 克 与 怀特 


e 引言 

e 字符 分 类 
分 类 函数 ; 字符 茜 取 

。 字符 串 
string 与 C 风格 字符 串 ; 构造 函数 ; 基本 操作 ; 字符 串 WO; 数值 转换 ; 类 STL 操作 ; 
find 系列 函数 ; 子 串 


e 建议 
36.1 引言 


在 <cctype> 中 ,标准 库 提供 了 字符 分 类 操作 ( 见 36.2 节 )， 在 <string> 中 提供 了 字 
符 串 相关 操作 ( 见 36.3 节 )， 在 <regex> 中 提供 了 正则 表达 式 匹 配 组 件 ( 见 37 章 ), 在 
<cstring> 中 提供 了 C 风格 字符 串 支持 ( 见 43.4 节 )。 不 同 字 符 集 的 处 理 、 编 码 和 区 域 习 惯 
(locale) 将 在 第 39 章 介 绍 。 

19.3 节 中 介绍 了 一 个 简化 的 string 实现 。 


36.2 ”字符 分 类 


标准 库 提 供 了 一 些 分 类 函数 ， 帮 助 用 户 操纵 字符 串 〈 及 其 他 字符 序列 )， 还 提供 了 一 些 
指出 字符 类 型 属性 的 萃取 ， 帮 助 实现 字符 串 上 的 操作 。 


36.2.1 分 类 函数 
在 <cctype> 中 ,标准 库 提供 了 从 基本 运行 字符 集中 分 类 字符 的 函数 : 


字符 分 类 
isspace(c) c 是 空白 符 (空格 ''、 水 平 制 表 符 \t'、 换 行 \n'、 垂 直 制 表 符 \w' 、 换 页 fF、 回 车 和 \r') 吗 ? 
isalpha(c) c 是 一 个 字母 ('a'..'z'、'A'..'Z') 吗 ? 注意 : 不 包括 下 划 线 ' 
isdigit(c) c 是 一 个 十 进 制 数字 ('0'..'9') 吗 ? 
isxdigit(c) c 是 一 个 十 六 进 制 数字 (十进制 数 字 或 'a'..f 或 'A'..'F') 吗 ? 
isupper(c) c 是 一 个 大 写字 母 吗 ? 
islower(c) c 是 一 个 小 写字 母 吗 ? 
isalnum(c) isalpha(c) 或 isdigit(c) ? 
iscntrl(c) c 是 一 个 控制 字符 (ASCII 0..31 和 127 ) 吗 ? 


ispunct(c) C 不 是 字母 、 数 字 、 空 白 符 或 可 见 的 控制 字符 吗 ? 








( 续 ) 
字符 分 类 
isprint(c) c 是 可 打印 的 (ASCIT''..'~') 吗 ? 
isgraph(c) isalpha(c) 或 isdigit(c) 或 ispunct(c) ? 注意 : 不 包括 空格 


此 外 ， 标 准 库 提 供 了 两 种 去 除 大 小 写 区 别 的 有 用 函数 : 


大 小 写 
toupper(c) c 或 c 的 大 写 形式 
tolower(c) C 或 C 的 小 写 形式 


<cwctype> 中 提供 了 用 于 宽 字 符 的 类 似 函 数 。 

字符 分 类 函数 是 "C" 区 域 设置 敏感 的 ( 见 39.5.1 节 和 39.5.2 节 )。<locale> 提供 了 用 于 
其 他 区 域 设置 的 类 似 函 数 ( 见 39.5.1 节 )。 

这 些 字符 分 类 函数 很 有 用 ， 原 因 之 一 是 字符 分 类 其 实 比 看 起 来 要 麻烦 得 多 。 例 如 ， 一 个 
初学 者 可 能 会 这 样 编写 代码 : 

if ("a'<ch && ch<'z') 1// 一 个 小 写字 母 
下 面 的 写法 更 简洁 ， 而 且 可 能 更 高 效 : 

if (islower(ch)) /| 一 个 小 写字 母 


更 重要 的 是 ， 在 编码 空间 中 ,字母 并 不 保证 是 连续 编码 的 ， 所 以 第 一 段 代码 可 能 会 出 错 。 而 
且 ， 标准 字符 分 类 可 以 非常 容易 地 转换 为 男 一 种 区 域 设 置 ( 见 39.5.1 节 ): 
if (islower,danish) /丹麦 语 小 写字 母 
外 (假定 “danish” 是 丹麦 区 域 设 置 的 名 字 ) 
注意 ， 丹 麦 语 小 写字 母 比 英语 多 3 个 ， 因 此 第 一 段 代 码 显 式 测试 'a' 和 'z' 显然 是 错误 的 。 


36.2.2 字符 萃取 
如 23.2 节 所 示 ， 字 符 串 模板 原则 上 可 以 用 任何 具有 恰当 的 拷贝 操作 的 类 型 作为 其 字符 
类 型 。 但 是 ， 若 类 型 没有 用 户 自 定义 的 拷贝 操作 ， 性 能 会 有 提高 ， 实 现 也 会 简化 。 因 此 ， 标 
准 string 要 求 其 字符 类 型 必须 是 一 个 POD ( 见 8.2.6 节 )。 这 也 令 字符 串 的 IO 简单 且 高 效 。 
一 个 字符 类 型 的 属性 由 其 char_traits 定义 。 一 个 char_traits 是 以 下 模板 的 特例 化 版 本 : 


template<typename C> struct char_traits { }; 


所 有 char_traits 都 定义 在 命名 空间 std 中 ， 头 文件 <string> 中 给 出 了 标准 char_traits。 通 
用 char traits 本 身 是 没有 属性 的 ;， 只 有 特定 字符 类 型 的 特例 化 char_traits 才 有 属性 。 考 虑 
char_traits<char>: 


template<> 
struct char_traits<char> { 咱 char traits 操作 不 能 抛 出 异常 
using char_type = char; 


using int type = int; /字符 的 整数 值 的 类 型 
using off_type = streamoff; /在 流 中 的 偏 移 
using pos_type = streampos; // 在 流 中 的 位 置 


using state_type = mbstate ti; /多 字 节 流 状态 (39.4.6 ) 
je: 
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标准 库 提供 了 4 个 char_traits 特例 化 版 本 ( 见 iso.21.2.3 ); 


template<> struct char_ traits<char>; 

template<> struct char_ traits<char16_t>; 
template<> struct char traits<char32 t>; 
template<> struct char traits<wchar_t>; 


标准 char_traits 的 成 员 都 是 static 函数 : 


c=to_char_type(i) 
i=to_int_type(c) 
eq_int_type(c,c2) 
eq(c,c2) 

lt(c,c2) 
i=compare(p,p2,n) 
assign(c,c2) 
p2=assign(p,n,c) 
p3=move(p,p2,n) 
p3=copy(p,p2,n) 
n=length(p) 
p2=find(p,n,c) 
i=eof() 


i=not_eof(i) 


char_traits<C> static 成 员 ( 见 iso.21.2 ) 
int type 到 char_type 的 转换 
char_type 到 int_type 的 转换 
to_int_type(c)==to_int_type(c2) 
c 与 c2 是 等 同 对 待 的 字符 ? 
c 按 小 于 c2 对 待 ? 
字典 序 比 较 [p:p+n) 和 [p2:p2+n) 
将 char_type 的 c2 赋予 c 
将 c 的 n 个 拷贝 赋予 [p:p+n) 间 的 元 素 ; p2=p 
将 [p:p+n) 间 的 元 素 拷贝 到 [p2:p2+n); 两 个 区 间 可 以 重 春 ;p3=p 
将 [p:p+n) 间 的 元 素 拷贝 到 [p2:p2+n); 两 个 区 间 不 能 重合 ; p3=p 
n 为 [p:q) 间 的 字符 数 ， 其 中 *q 是 满足 eq(*q,charT{}) 的 第 一 个 元 素 
p2 指向 [p:p+n) 中 c 第 一 次 出 现 的 位 置 ， 或 者 为 nullptr 
i 为 表示 文件 尾 的 int_type 值 
若 !eq_int_type(ieof())， 则 得 到 i; 否则 i 可 能 变 成 任何 不 等 于 eof() 的 值 





用 eq() 进行 比较 通常 并 不 是 简单 使 用 ==。 例 如 ， 一 个 大 小 写 不 敏感 的 char_traits 会 将 其 
eq() 定义 为 eq('b','B') 返回 true。 

由 于 copy() 并 不 保护 重 琶 的 区 域 ， 它 可 能 比 move() 更 快 。 

函数 compare() 用 It() 和 eq() 比较 字符 。 它 返回 一 个 int，0 表示 严格 匹配 ， 负 数 表 
示 第 一 个 实 参 在 字典 序 中 排 在 第 二 个 实 参 之 前 ， 而 正 数 则 意味 着 第 一 个 实 参 在 第 二 个 实 参 
之 后 。 

VO 相关 的 函数 被 用 于 底层 IO 的 实现 ( 见 38.6 节 )。 


36.3 ”字符 串 
在 <string> 中 ， 标 准 库 提 供 了 通用 字符 串 模 板 basic_string : 


template<typename C, 
typename Tr = char _ traits<C>, 
typename A = allocator<C>> 
class basic_string { 
public: 
using traits_type = Tr; 
using value_type = typename Tr::char_type; 
using allocator_type = Ai; 
using size_type = typename allocator traits<A>::size_type:; 
using difference_type = typename allocator traits<A>::difference_type; 
using reference = value_ type&; 
using const_reference = const value_type&i; 
using pointer = typename allocator traits<A>::pointer; 
using const_pointer = typename allocator traits<A>:;:const_pointer; 


巡 36 昔 他 符 只 149 


using iterator =* 由 具体 实现 定义 虽 ; 

using const_iterator =/* 由 具体 实现 定义 */; 

using reverse iterator = std::reverse_iterator<iterator>; 

using const_reverse_ iterator = std::reverse_iterator<const_iterator>; 


static const size_type npos = -1; /表示 字符 串 尾 的 整数 
hs 
}; 
元 素 (字符 串 ) 是 连续 存储 的 ， 这 样 底 层 输入 操作 可 以 安全 地 将 basic_string 的 字符 序列 作 
为 源 或 目的 。 
basic_string 提供 了 强 保证 ( 见 13.2 节 ) : 若 一 个 basic_string 操作 抛 出 了 异常 ， 则 字 
符 串 保持 不 变 。 
对 一 些 标准 字符 类 型 ， 标 准 库 已 经 提供 了 相应 的 特例 化 版 本 : 


using string = basic_string<char>; 

using u16string = basic_ string<char16 _t>; 
using u32string = basic_ string<char32 t>; 
using wstring = basic_ string<wchar_t>; 


所 有 这 些 字符 串 都 提供 很 多 操作 。 
与 容器 类 似 ( 见 第 31 章 )，basic_string 的 设计 目的 不 是 为 了 用 作 基 类 ， 而 且 它 提供 了 
移动 语义 ， 因 此 能 高 效 地 以 传 值 方式 由 函数 返回 。 


36.3.1 string 与 C 风格 字符 串 


我 假定 读者 通过 本 书 中 的 很 多 示例 已 经 较为 熟悉 string 了 ， 因 此 本 节 从 一 些 例子 开始 ， 
它们 对 比 了 string 的 使 用 和 C 风格 字符 串 的 使 用 ( 见 43.4 节 )， 后 者 在 主要 熟悉 C 和 C 风格 
C++ 的 程序 员 中 很 流行 。 

考虑 通过 连接 用 户 标识 符 和 域名 来 构造 一 个 电子 邮件 地 址 : 


string address(const string& identifier const string& domain) 





return identifier + '@' + domain; 

} 

void test() 

{ 
string t = address("bs","somewhere"); 
cout <<t << \n'; 

. 


这 个 例子 很 简单 ， 接 下 来 考虑 一 个 很 正确 的 C 风格 版 本 。 一 个 C 风格 的 字符 串 就 是 一 个 指 
向 以 零 结尾 的 字符 数组 的 指针 。 用 户 控制 内 存 分 配 并 负责 释放 : 
char* address(const char: identifier, const char* domain) 
{ 
int iden_len = strlen(identifier); 
int dom_len = strlen(domain); 
char* addr = (char*)malloc(iden_len+dom_len+2); 咱 记 得 分 配 0 和 '@' 占用 的 空间 
strcpy(identifier,addr); 
addr[liden_len] = '@'; 
strcpy(domain,addr+iden_len+1); 
return addr; 











void test2() 

{ 
char* t= address("bs","somewhere"); 
printf("%s\n",t); 
free(t); 

} 


我 编写 的 这 段 代 码 正确 吗 ? 我 希望 它 是 正确 的 。 至 少 它 给 出 了 期 望 的 输出 结果 。 与 大 多 数 
有 经 验 的 C 程序 员 一 样 ， 我 第 一 次 就 写 出 了 正确 的 C 版 本 (我 希望 是 )， 但 其 实 编写 出 正 
确 版 本 需要 注意 很 多 细节 。 经 验 ( 即 错误 记录 ) 显示 ， 我 们 并 不 是 总 能 第 一 次 就 写 出 正确 
版 本 。 这 种 简单 的 编程 任务 常常 会 交 给 相对 的 新 手 去 做 ， 而 他 们 还 尚未 掌握 所 有 需要 注意 
的 细节 技术 。 实 现 C 风格 的 address() 包含 很 多 麻烦 的 指针 操作 ， 且 其 使 用 要 求 调用 者 记 
得 释放 返回 的 内 存 。 使 用 string 的 address() 和 C 风格 的 address()， 你 更 希望 维护 哪 种 
代码 呢 ? 

我 们 有 时 会 听 到 C 风格 字符 串 比 string 更 高 效 的 论调 。 但 是 ， 对 大 多 数 用 途 而 言 ， 
string 版 本 比 等 价 的 C 风格 版 本 执行 的 分 配 和 释放 操作 更 少 (因为 小 字符 串 优化 和 移动 
语义 的 缘故 ; 见 19.3.3 节 和 19.3.1 节 )。 而 且 ，strlen() 是 一 个 log(N) 时 间 的 操作 ， 而 
string::size() 只 是 一 个 简单 的 读 操 作 。 在 本 例 中 ， 这 意味 着 C 风格 代码 会 遍历 每 个 输入 字 
符 串 两 次 ， 而 string 版 本 只 会 遍历 一 次 。 在 这 个 层面 上 考虑 效率 问题 有 些 误 入 歧途 了 ， 但 
string 版 本 有 基本 的 性 能 保证 。 

C 风格 字符 串 与 string 的 根本 区 别 是 ，string 是 具有 常规 语义 的 真正 类 型 ， 而 C 风格 字 
符 串 则 是 一 些 有 用 的 函数 支撑 的 一 组 规范 。 考 虑 字符 串 的 赋值 和 比较 : 

void test3() 

{ 





string s1 = "Ring"; 

if (si1!="Ring") insanity(); 

if (s1<"Opera")cout << "check"; 
string s2 = address(s1,"Valkyrie"); 


char s3[] = "Ring"; 

if (stremp(s3,"Ring")!=0) insanity(); 

if (strcemp(s3,"Opera")<0) cout << "check"; 
char* s4 = address(s3,"Valkyrie"); 


free(s4); 

} 

最 后 ， 考 虑 字符 串 排 序 : 

void test4() 

{ 
vector<string> vs = {"Grieg", "Williams", "Bach", "Handel" }; 
sort(vs.begin(),vs.end()); 咱 假定 我 未 定义 sort(vs) 
const char* as[] = {"Grieg", "Williams", "Bach", "Handel" }; 
qsort(as,sizeof(*as),sizeof(as)/sizeof(*as),(int(*)(const void*,const void*))strcemp); 

} 


C 风格 字符 串 排 序 函 数 qsort() 在 43.7 节 中 介绍 。 再 重复 一 次 ，sort() 不 比 qsort() 慢 (而 
且 通 常 更 快 )， 因此 从 性 能 角度 考虑 没有 理由 选择 更 底层 、 更 宛 长 也 更 不 易 维护 的 编程 
风格 。 








36.3.2 ”构造 函数 
basic_string 提供 了 各 式 各 样 令 人 眼花 综 乱 的 构造 函数 : 


basic_string<C,Tr,A> 构造 函数 (iso.21.4.2 ) 
x 可 以 是 一 个 basic_string 、 一 个 C 风格 字符 串 或 一 个 initializer_list<char_type> 


basic_string s {a}; s 是 一 个 空 字符 串 ， 分 配器 为 a; 显 式 构造 函数 
basic_string s {}; 默认 构造 函数 : basic_string s {AfT}}; 
basic_string s {x,a}; s 从 x 获得 字符 ; 分 配器 为 a 
basic_string s {x); 移动 和 拷贝 构造 函数 : basic_string s {x,Af}}; 
basic_string s {s2,pos,n,a}; s 获得 字符 s2[pos:pos+n); 分 配器 为 a 
basic_string s {s2,pos,n}; basic_string s {s2,pos,n,A{}}; 
basic_string s {s2,pos}; basic_string s {s2,pos,string::npos,A{}}; 
basic_string s {p,n,a}; 用 [p:p+n) 初始 化 s; p 是 一 个 C 风格 字符 串 ; 分 配器 为 a 
basic_string s {p,n}; basic_string s {p,n,A{}}; 
basic_string s {n,c,a}; s 保存 字符 c 的 n 个 拷贝 ; 分 配器 为 a 
basic_string s {n,c}; basic_string s {n,c,Af{}}; 
basic_string s {b,e,a}; s 从 [b:e) 获得 字符 ; 分 配器 为 a 
basic_string s {b,e}; basic_string s {b,e,A{}}; 
s.basic_string() 析 构 函数 : 释放 所 有 资源 
S=X 拷贝 : s 从 x 获 得 字符 
s2=move(s) 移动 : s2 从 s 获得 字符 ; 不 抛 出 异常 

最 常用 也 是 最 简单 的 : 
string s0; 放空 字符 串 
string s1 {"As simple as thati"};  // 用 C 风格 字符 串 构 造 
string s2 {s1}; 川 拷贝 构造 函数 


析 构 函数 几乎 总 是 被 隐 式 调用 。 
string 没有 只 接受 元 素数 目的 构造 函数 : 


string s3 {7}; /错误 : 没有 string(int) 
string s4 {'a'}; 咱 错 误 : 没有 string(char) 
string s5 {7,'a'}; /1 正确: 7 个 'a' 

string s6 {0}; /危险 : 传递 nullptr 


s6 的 声明 展示 了 习惯 使 用 C 风格 字符 串 的 程序 员 常 犯 的 一 个 错误 : 
const char* p = 0; /将 p 设 置 为 “无 字符 串 ” 


不 幸 的 是 ， 编 译 器 不 能 捕获 s6 的 定义 以 及 更 为 糟糕 的 const char 保存 nullptr 的 情况 : 
string s6 {0}; /危险 : 传递 nullptr 
string s7 {p}; 咱 可 能 正确 ， 也 可 能 不 正确 ， 依 赖 于 p 的 值 
string s8 {"OK")};  // 正 确 : 传递 指针 给 C 风格 字符 串 
不 要 尝试 用 一 个 nullptr 初始 化 一 个 string。 最 好 情况 下 ， 你 会 得 到 一 个 糟糕 的 运行 时 错误 。 
而 最 坏 情况 下 ， 你 会 得 到 难以 理解 的 未 定义 行为 。 
如 果 你 试图 构造 一 个 string 保存 C++ 实现 无 法 处 理 的 字符 数量 ， 构 造 函 数 会 抛 出 
std::length_error。 例 如 : 
string s9 {string::npos,'x”); 。 // 抛 出 length_error 
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值 string::npos 表示 一 个 超出 string 长 度 的 位 置 ， 通 常用 来 表示 “string 尾 ”。 例 如 : 


string ss {"Fleetwood Mac"}; 
string ss2 {ss,0,9); /lI "Fleetwood" 
string ss3 {ss,10,string::npos}; lI "Mac" 


注意 ， 子 串 表 示 方 式 是 (位 置 ， 长 度 ) 而 不 是 [ 开始， 结束)。 

不 存在 string 类 型 的 字面 常量 。 你 可 以 自 定义 字面 常量 类 型 来 解决 此 问题 ( 见 19.2.6 
节 )， 例 如 "The Beatles"s 和 "Elgar"s。 注 意 后 缀 s。 
36.3.3 ”基本 操作 

basic_string 提供 了 比较 操作 、 大 小 和 容量 控制 操作 以 及 访问 操作 。 


basic_string<C,Tr,A> 比较 (iso.21.4.8 ) 
s 或 s2 之 一 可 以 是 C 风格 字符 串 ， 但 不 能 都 是 


S==S2 s 等 于 s2? 用 traits_type 比较 字符 值 
S!=S2 !(s==s2) 

s<s2 s 在 字典 序 中 比 s2 更 靠 前 ? 

s<=s2 s 在 字典 序 中 比 s2 更 靠 前 或 两 者 相等 ? 
s>s2 s 在 字典 序 中 比 s2 更 靠 后 ? 

s>=s2 s 在 字典 序 中 比 s2 更 靠 后 或 两 者 相等 ? 


更 多 比较 操作 见 36.3.8 节 。 
basic_string 的 大 小 和 容量 机 制 与 vector 相同 ( 见 31.3.3 节 ); 


basic_string<C,TrA> 大 小 和 容量 操作 (iso.21.4.4 ) 








n=s.size() n 为 s 中 的 字符 数 

n=s.length() n=s.size() 

n=s.max_size() n 为 s.size() 的 最 大 可 能 值 
s.resize(n,c) 令 s.size()==n; 新 增 元 素 的 值 均 为 c 
s.resize(n) s.resize(n,C{}) 

s.reserve(n) 确保 s 不 用 分 配 更 多 空间 即 可 保存 n 个 字符 
s.reserve() 无 影响 : s.reserve(0) 

n=s.capacity() s 无 需 分 配 更 多 空间 即 可 保存 n 个 字符 
s.shrink_to_fit() 令 s.capacity==s.size() 

s.clear() 令 s 变 为 空 

s.empty() S 为 空 ? 

a=s.g et_allocator() a 为 s 的 分 配器 


车 resize() 或 reserve() 会 令 size() 超过 max_size()， 则 抛 出 std::length_error。 
一 个 示例 : 


void fill(istream& in, string& s, int max) 
咱 将 s 用 作 底 层 输 入 操作 的 目标 存储 (简化 版 ) 
{ 
s.reserve(max); // 确 保有 足够 的 空间 
in.read(&s[0],max); 
const int n = in.qcount(); // 读 入 的 字符 数 
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s.resize(n); 
s.shrink_to_fit(); 儿 丢弃 多 余 的 容量 
} 


这 里 我 “忘记 了 ”利用 读 和 的 字符 数 ， 使 代码 有 些 乱 。 


basic_string<C,Tr,A> 访问 操作 (iso.21.4.5 ) 


s[i] 下 标 操作 : s[i] 为 指向 s 的 第 i 个 元 素 的 引用 ; 不 进行 范围 检查 

s.at(i) 下 标 操作 : s.at(i) 为 指向 s 的 第 i 个 元 素 的 引用 ; 若 s.size()<=i 抛 出 range_error 

s.front() S[o] 

s.back() s[s.size()-1] 

s.push_back(c) 追加 字符 c 

s.pop_back() 删除 s 的 尾 字符 : s.erase(s.size()-1) 

S+=X 在 s 的 未 尾 追加 x; x 可 以 是 一 个 字符 、 一 个 string、 一 个 C 风 格 字符 串 或 一 个 
initializer_list<char_type> 

s=s1+s2 连接 : s=s1; s+=s2; 的 优化 版 本 


n2=s.copy(s2,n,pos) 从 s2[pos:n2) 拷贝 字符 到 s， 其 中 n2 为 min(n,s.size()-pos) ; 若 s.size()<pos 抛 
出 out_of_range 





n2=s.copy(s2,n) s 从 s2 获得 所 有 字符 ; n=s.copy(s2,n,0) 

p=s.c_str() p 为 s 的 C 风格 字符 串 版 本 (以 零 结尾 )， 类 型 为 const C* 
p=s.data() p=s.c_str() 

s.swap(s2) 交换 s 和 s2 的 值 ; 不 抛 出 异常 

swap(s,s2) s.swap(s2) 


用 at() 进行 越界 访问 会 抛 出 std::out_of_range。 若 +=()、push_back() 或 + 会 令 size() 超 
过 max_size()， 则 抛 出 std::length_error。 

不 存在 string 到 char* 的 隐 式 类 型 转换 。 人 们 已 经 在 很 多 地 方 对 此 进行 了 尝试 ， 发 现 它 
很 容易 出 错 。 因 此 ， 标 准 库 提供 string 到 const char* 的 显 式 转换 函数 c_str()。 

一 个 string 可 以 包含 值 为 零 的 字符 (如 \0')。 对 这 类 string 的 s.c_str() 或 s.data() 结 
果 执 行 strcmp() 这 样 的 函数 (这 类 函数 假定 处 理 的 是 C 风格 字符 串 ) 会 导致 出 人 意料 的 
结果 。 


36.3.4 字符 串 I/O 


我 们 可 以 用 << ( 见 38.4.2 节 ) 输出 basic_string， 以 及 用 >> ( 见 38.4.1 节 ) 读 取 输入 
保存 到 basic_string 中 : 


basic_string<C,Tr,A>I/O 操作 (iso.21.4.8.9 ) 


in>>s 从 in 读 取 一 个 空白 符 分 隔 的 单词 存 人 s 

out<<s 将 s 输出 到 cout 

getline(in,s,d) 从 in 读 取 字符 存 人 s 直至 遇 到 字符 d; d 会 从 in 中 删除 ， 但 不 会 追加 到 s 
getline(in,s) getline(in,s,"\n')， 其 中 \n' 会 被 扩展 ， 以 匹配 string 的 字符 串 类 型 


若 输 入 操作 会 令 size() 超过 max_size()， 则 抛 出 std::length_error。 
getline() 会 从 输入 流 中 删除 结束 符 (默认 为 \n'), 但 不 将 其 存 和 人 字符 串 中 。 这 简化 了 对 
输入 的 逐 行 处 理 。 例 如 : 
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vector<string> lines; 
for (string s; getline(cin,s);) 
lines.push_back(s); 


string 的 IO 操作 都 返回 指向 输入 流 的 引用 ， 因 此 可 将 它们 串 接 起 来 。 例 如 : 


string first_name:; 
string second_name:; 
cin >> first_name >> second_name; 


在 从 输入 流 读 取 数据 之 前 ， 作 为 目标 存储 的 string 会 被 设置 为 空 ， 在 读 取 过 程 中 会 逐步 扩展 
它 来 保存 读 入 的 字符 。 到 达 文 件 尾 时 读 操 作 也 会 停止 ( 见 38.3 节 ) 


36.3.5 “数值 转换 


在 <string> 中 ， 标 准 库 提 供 了 一 组 函数 ， 可 从 一 个 string 或 一 个 wstring (注意 : 不 是 
basic_string<C,Tr,A>) 中 抽取 出 数值 (字符 串 内 容 是 该 数值 的 字符 串 表示 )。 函 数 名 提示 了 
要 求 的 数值 类 型 : 


数值 转换 (iso.21.5 ) 
s 可 以 是 一 个 string 或 一 个 wstring 


x=stoi(s,p,b) 字符 串 转换 为 int ; x 是 转换 得 到 的 整数 ; 从 s[0] 开始 读 取 ; 若 pl=nullptr，*p 
被 设置 为 用 来 转换 的 字符 数 ; b 是 数值 的 基数 (从 2 到 36, 包括 2 和 36) 

x=stoi(s,p) Xx=stoi(s,p,10); 转换 为 十 进 制 数 

x=stoi(s) x=stoi(s,nullptr,10); 转换 为 十 进 制 数 ; 不 报告 字符 数 

x=stol(s,p,b) 字符 串 转 换 为 long 

x=stoul(s,p,b) 字符 串 转换 为 unsigned long 

x=stoll(s,p,b) 字符 串 转 换 为 long long 

x=stoull(s,p,b) 字符 串 转 换 为 unsigned long 

x=stof(s,p) 字符 串 转 换 为 float 

x=stod(s,p) 字符 串 转换 为 double 

x=stold(s,p) 字符 串 转换 为 long double 

s=to_string(x) s 是 x 的 string 表示 ; 必须 是 一 个 整数 或 一 个 浮 点 值 

ws=to_wstring(x) s 是 x 的 wstring 表示 ; 必须 是 一 个 整数 或 一 个 浮 点 值 


类 似 stoi， 每 个 sto* (字符 串 转 换 为 ) 函数 都 有 三 个 变 体 。 例 如 : 


string s = "123.45"; 
auto x1 = stoi(s); ll/xl = 123 
auto x2 = stod(s); I1x2= 123.45 


sto* 函数 的 第 二 个 参数 是 一 个 指针 ， 用 来 指出 数值 转换 过 程 搜索 了 字符 串 中 的 多 少 个 字符 。 
例如 : 


string ss = "123.4567801234"; 


size_t dist = 0; /将 读 取 的 字符 数 保存 在 这 里 
auto x = stoi(ss,&dist); l1x= 123 (一 个 整数 ) 

++dist; 咱 忽略 小 数 点 

auto y = stoll(&ss[dist]); lI/x =4567801234 (一 个 long long) 


这 种 从 字符 串 中 解析 多 个 数值 的 方法 并 不 是 我 所 喜欢 的 方式 ， 我 更 倾向 于 使 用 string- 
stream ( 见 38.2.2 节 )。 
在 进行 转换 时 ， 会 跳 过 开始 的 空白 符 。 例 如 : 
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strings=" 123.45"; 

auto x1 = stoi(s); /xl = 123 
基数 实 参 的 值 必 须 在 范围 [2:36] 内 , 0123456789abcdefghijkImnopqrstuvwxyz 可 作为 数字 ， 
它们 的 值 由 此 排列 顺序 确定 。 任 何其 他 基数 值 都 将 是 一 个 错误 ， 或 者 是 对 标准 转换 函数 进行 
了 扩展 。 例 如 : 


string s4 = "149F"; 


auto x5 = stoi(s4); lI!x5= 149 
auto x6 = stoi(s4,nullptr,10); lx6= 149 
auto x7 = stoi(s4,nullptr,8); lx7= 014 
auto x8 = stoi(s4,nullptr,16); ll x8 = 0x149F 


string s5 = "1100101010100101"; ”// 二 进 制 
auto x9 = stoi(s5,nuliptr,2); /省 x9 = Oxcaa5 


如 果 一 个 转换 函数 在 其 字符 串 实 参 中 未 找到 能 够 转换 为 数值 的 字符 ， 它 会 抛 出 invalid_ 
argument。 如 果 它 发 现 了 一 个 不 能 表示 为 目标 类 型 的 数值 ， 会 抛 出 out_of_range ; 如 果 是 
转换 到 浮 点 类 型 ， 还 会 将 errno 设置 为 ERANGE ( 见 40.3 节 )。 例 如 : 


stoi("Hello, World!™"); // 抛 出 std::invalid argument 
stoi("12345678901234567890"); // 抛 出 std::out_of range; errno=ERANGE 
stof("123456789e1000"); // 抛 出 std::out_of range; errno=ERANGE 


sto* 函数 的 命名 提示 了 转换 的 目标 类 型 。 这 意味 着 它们 不 适合 编写 目标 类 型 为 模板 参数 的 通 
用 代码 。 对 这 类 情况 ， 可 考虑 to<X> ( 见 25.2.5.1 节 ) 


36.3.6 类 STL 操作 
basic_string 提供 了 一 组 有 用 的 迭代 器 : 


basic_string<C,Tr,A> 字符 串 和 迭代 器 (iso.21.4.3 ) 





所 有 操作 都 不 抛 出 异常 
p=s.begin() p 为 指向 s 的 第 一 个 字符 的 iterator 
p=s.end() p 为 指向 s 末 尾 之 后 位 置 的 iterator 
p=s.cbegin() p 为 指向 首 字符 的 const_iterator 
p=s.cend() p 为 指向 尾 后 位 置 的 const_iterator 
p=s.rbegin() p 指向 s 的 逆序 序列 的 起 始 位 置 
p=s.rend() p 指向 s 的 逆序 序列 的 末尾 位 置 
p=s.crbegin() p 为 指向 s 的 逆序 序列 的 起 始 位 置 的 const_iterator 
p=s.crend() p 为 指向 s 的 逆序 序列 的 末尾 位 置 的 const_iterator 





由 于 string 的 成 员 类 型 和 函数 符合 要 求 ， 可 以 获得 迭代 器 ， 因 此 string 可 以 用 于 标准 库 算 法 
( 见 第 32 章 )。 例 如 : 
void f(string& s) 
{ 
auto p = find_if(s.begin(),s.end(),islower); 
ls 
} 


String 直接 提供 了 最 常用 的 字符 串 操 作 。 希 望 这 些 版 本 对 String 进行 了 优化 ， 超 出 对 通用 算 
法 进行 的 简单 优化 。 


标准 库 算 法 〈 见 第 32 章 ) 之 于 字符 串 并 不 像 我 们 认为 的 那样 有 用 。 通 用 算法 都 假定 容器 中 
的 元 素 是 相互 独立 的 ， 而 字符 串通 常 并 不 是 这 样 的 。 
basic_string 提供 了 复杂 的 赋值 操作 assignment(): 


basic_string<C,Tr,A> 赋值 (iso.21.4.6.3 ) 


所 有 操作 都 返回 所 操作 的 字符 串 
s.assign(x) s=X; X 可 以 是 一 个 string、 一 个 C 风格 字符 串 或 一 个 initializer_list<char_type> 
s.assign(move(s2)) 移动 : s2 是 一 个 string; 不 抛 出 异常 
s.assign(s2,pos,n) s 获得 字符 s2[pos:pos+n) 
s.assign(p,n) s 获得 [p:p+n) 间 的 字符 ; p 是 一 个 C 风格 字符 串 
s.assign(n,c) s 获得 字符 c 的 mn 个 拷贝 
s.assign(b,e) s 从 [b:e) 获得 字符 


我 们 可 以 在 一 个 basic_string 中 进行 insert()、append() 和 erase(): 


basic_string<C,Tr,A> 插入 和 删除 (iso.21.4.6.2，iso.21.4.6.4，iso.21.4.6.5 ) 


所 有 操作 都 返回 所 操作 的 字符 串 
s.append(x) 将 x 追加 到 s 的 末尾 ; x 可 以 是 一 个 字符 、 一 个 string、 一 个 C 风格 字符 串 或 一 
个 initializer_list<char_type> 
s.append(b,e) 将 [b:e) 追加 到 s 的 末尾 
s.append(s2,pos,n) 将 s2[pos:pos+n) 追加 到 s 的 末尾 
s.append(p,n) 将 [p:p+n) 间 的 字符 追加 到 s 的 末尾 ; p 是 一 个 C 风格 字符 串 
s.append(n,c) 将 字符 c 的 nm 个 拷贝 追加 到 s 的 末尾 
s.insert(pos,x) 将 x 插入 s[pos] 之 前 ; x 可 以 是 一 个 字符 、 一 个 string、 一 个 C 风格 字符 串 或 一 
个 initializer_list<char_type> 
s.insert(p,c) 将 x 插入 迭代 器 p 之 前 
s.insert(p,n,c) 将 字符 c 的 nm 个 拷贝 插入 迭代 器 p 之 前 
s.insert(p,b,e) 将 [b:e) 插入 迭代 器 p 之 前 
s.erase(pos) 删除 s 中 从 s[pos] 开始 到 末尾 的 所 有 字符 ; s.size() 变 为 pos 
s.erase(pos,n) 删除 s 中 从 s[pos] 开始 的 n 个 字符 ; s.size() 变 为 max(pos,s.size()-n) 
例如 : 
void add_middie(string& s, const string& middie) 咱 添加 中 间 名 
, auto p = s.find(' "); 
s.insert(p,' +middle); 
} 
void test() 
string dmr = "Dennis Ritchie”; 
add_middle(dmr "MacAlistair ); 
cout << dmr << \n'; 
} 


类 似 vector，string 的 append() (在 尾部 添加 字符 ) 通常 比 在 其 他 位 置 进 行 insert() 更 高 效 。 
接 下 来 ， 我 将 用 s[b:e) 表示 s 中 的 元 素 序 列 [b:e): 
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basic_string<C,Tr,A> 替换 (iso.21.4.6.6 ) 


所 有 操作 都 返回 所 操作 的 字符 串 
s.replace(pos,n,s2,pos2,n2) 将 s[pos:pos+n) 替换 为 s2[pos2:pos2+n2) 
s.replace(pos,n,p,n2) 将 s[pos:pos+n) 替换 为 [p:p+n2); p 是 一 个 C 风格 字符 串 
s=s.replace(pos,n,s2) 将 s[pos:pos+n) 替换 为 s2; s2 是 一 个 string 或 是 一 个 C 风格 字符 串 
s.replace(pos,n,n2,c) 将 s[pos:pos+n) 蔡 换 为 字符 c 的 n2 个 拷贝 
s.replace(b,e,x) 将 [b:e) 替换 为 x; x 可 以 是 一 个 string、 一 个 C 风格 字符 串 或 一 个 initializer_ 
list<char_type> 
s.replace(b,e,p,n) 将 [b:e) 替换 为 [p:p+n) 
s.replace(b,e,n,c) 将 [b:e) 替换 为 字符 c 的 n 个 拷贝 
s.replace(b,e,b2,e2) 将 [b:e) 替换 为 [b2:e2) 


replace() 函数 将 一 个 子 串 替换 为 另 一 个 子 串 ， 并 相应 调整 string 的 大 小 。 例 如 : 


void f() 

{ 
string s = "but | have heard it works even if you don't believe in it"; 
s.replace(0,4,""); 儿 删除 开始 的 "but" 
s.replacel(s.find("even"),4,"only"); 
s.replace(s.find(" don't"),6,""); 咱 用 "替换 ， 即 删除 


assert(s=="| have heard it works only if you believe in it"); 


} 


依赖 于 “ 魔 数 ” 一 一 例如 要 替换 的 字符 数 一 一 的 代码 很 容易 出 错 。 
replace() 函数 返回 一 个 指向 其 处 理 的 字符 串 对 象 的 引用 ， 因 此 可 将 替换 操作 串联 起 来 : 


void f2() 


string s = "but | have heard it works even if you don't believe in it"; 
s.replace(0,4,"").replacel(s.find("even"),4,"only").replacel(s.find(" don't"),6,""); 
assert(s=="| have heard it works only if you believe in it"); 


} 


36.3.7 find 系列 函数 


标准 库 提供 了 各 种 各 样 令 人 眼花 练 乱 的 子 串 查找 操作 。 照 例 ，find() 从 s.begin() 开始 向 后 搜 
索 ，rfind() 从 s.end() 开始 向 前 搜索 。find() 函数 用 string::npos(“ 非 位 置 ”) 来 表示 “未 找到 ”。 


basic_string<C,TrA> 查找 元 素 (iso.21.4.7.2 ) 
x 可 以 是 一 个 字符 、 一 个 string 或 一 个 C 风格 字符 串 。 所 有 操作 都 不 抛 出 异常 


pos=s.find(x) 在 s 中 查找 x; pos 为 匹配 的 第 一 个 字符 的 下 标 或 string::npos 
pos=s.find(x,pos2) pos=s.find(basic_string(s,pos2) 
pos=s.find(p,pos2,n) pos=s.find(basic_string{p,n},pos2) 
pos=s.rfind(x,pos2) 在 s[0:pos2) 中 查找 x; pos 为 最 接近 s 末 尾 的 匹配 的 第 一 个 字符 的 位 置 或 
string::npos 
pos=s.rfind(x) pos=s.rfind(x,string::npos) 
pos=s.rfind(p,pos2,n) pos=s.rfind(basic_string{p,n},pos2) 
例如 : 
void f() 


string s {"accdcde"}); 
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auto i1 = s.find("cd"); /Iil==2 s[2] 一 'c && s[3] 一 'd 
auto i2 = s.rfind("cd"); I i2==4 s[4]—'c' && s[5]=='d' 
} 


find_*_of() 系列 函数 与 find() 和 rfind() 的 不 同 之 处 在 于 它 查找 单个 字符 而 非 一 个 字符 序列 : 


basic_string<C,Tr,A> 查找 集合 中 元 素 (iso.21.4.7.4 ) 
x 可 以 是 一 个 字符 、 一 个 string 或 一 个 C 风格 字符 串 ; p 是 一 个 C 风格 字符 串 。 所 有 操作 都 不 抛 出 异常 


pos2=s .find_first_of(x,pos) 在 s[pos:s.size()) 中 查找 x 中 的 字符 ; pos2 为 s[pos:s.size()) 中 第 一 
个 来 自 于 x 中 的 字符 的 位 置 或 string::npos 

pos=s.find_ first_of(x) pos=s.find_first_of(x,0) 

pos2=s.find_first_of(p,pos,n) pos2=s .find_first_of(basic_string{p,n},pos) 

pos2=s.find_last_of(x,pos) 在 s[0:pos) 中 查找 x 中 的 字符 ; pos 为 最 接近 s 末尾 的 来 自 于 x 中 的 字 
符 的 位 置 或 string::npos 

pos=s.find_last_of(x) pos=s.find_last_of(x,0) 

pos2=s.find_last_of(p,pos,n) pos2=s.find_last_of(basic_string{p,n},pos) 

pos2=s.find_first_not_of(x,pos) 在 s[pos:s.size()) 中 查找 非 x 中 的 字符 ; pos2 为 s[pos:s.size()) 中 第 
一 个 不 是 来 自 于 x 中 的 字符 的 位 置 或 string::npos 

pos=s .find_first_not_of(x) pos=s .find_first_not_of(x,0) 


pos2=s .find_first_not_of(p,pos,n) pos2=s .find_first_not_of(basic_string{p,n},pos) 
pos2=s.find_last_not_of(x,pos) 在 s[0:pos) 中 查找 非 x 中 的 字符 ; pos 为 最 接近 s 末尾 的 不 是 来 自 于 x 
中 的 字符 的 位 置 或 string::npos 


pos=s.find_last_not_of(x) pos=s.find_last_not_of(x,0) 
pos2=s.find_last_not_of(p,pos,n) pos=s.find_last_not_of(basic_string{p,n},pos) 
例如 : 
string s {"accdcde"); 
auto i1 = s.find("cd"); I1il==2 s[2 一 'c && s[3]=='d' 
auto i2 = s.rfind("cd"); lI i2==4 s[4]=='c' && s[5]=='d' 
auto i3 = s.find_first_of("cd"); 1 13==1 s[1]=='e 
auto i4 = s.find_last_of("cd"); /| i14==5 s[5]=="d' 
auto i5 = s.find_first_not_of("cd"); li5==0 s[0]!='c && s[0]!="d' 
auto i6 = s.find_last_not_of("cd"); /1 16==6 s[6]!='c' && s[6]!='d' 
36.3.8 子囊 


basic_string 提供 了 子 串 的 底层 表示 : 


basic_string<C,TrA> 子 串 (iso.21.4.7.8 ) 


s2=s.substr(pos,n) s2=basic_string(&s[pos],m)， 其 中 m=min(s.size()-pos,n) 
s2=s.substr(pos) s2=s.substr(pos,string::npos) 
s2=s.substr() s2=s.substr(0,string::npos) 


注意 ，substr() 创建 一 个 新 字符 串 : 


void user() 


{ 
string s = "Mary had a little lamb"; 
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string s2 = s.Substr(0,4); I/ s2 == "Mary" 
s2 = "Rose"; 儿 不 会 改变 s 
} 


我 们 可 以 比较 子 串 : 


basic_string<C,Tr,A> 比较 (iso.21.4.7.9 ) 
n=s.compare(s2) 按 字典 序 比 较 s 和 s2 ; 用 char traits<C>::compare() 进行 比较 ; 若 
s==s2 则 n=0; 若 s<s2 则 n<0; 若 s>s2 则 n>0; 不 抛 出 异常 
n2=s.compare(pos,n,s2) n2=basic_string{fs,pos,n}.compare(s2) 
n2=s.compare(pos,n,s2,pos2,n2) n2=basic_string{s,pos,n}.compare(basic_string{s2,pos2,n2}) 
n=s.compare(p) n=s.compare(basic_string{p});; p 是 一 个 C 风格 字符 串 
n2=s.compare(pos,n,p) n2=basic_string{s,pos,n}.compare(basic_string{p}); p 是 一 个 C 风 
格 字符 串 
n2=s.compare(pos,n,p,n2) n2=basic_string{s,pos,n}.compare(basic_string{p,n2}) ; p 是 一 个 C 


风格 字符 串 








例如 : 
void f() 
{ 
string s = "Mary had a little lamb"; 
string s2 = s.substr(0,4); 1/s2 == "Mary" 
auto i1 = s.compare(s2); /il 是 正 数 
auto i2 = s.compare(0,4,s2); //i2==0 


} 
这 种 显 式 使 用 常量 表示 位 置 和 长 度 的 代码 很 脆弱 、 很 容易 出 错 。 
36.4 建议 
[ 使 用 字符 分 类 而 非 手 工 编写 的 代码 检查 字符 范围 ，36.2.1 节 。 
如 果实 现 类 字符 串 的 抽象 ， 使 用 character_traits 实现 字符 上 的 操作 ; 36.2.2 节 。 
可 用 basic_string 创建 任意 字符 类 型 的 字符 串 ; 36.3 节 。 
将 string 用 作 变 量 和 成 员 而 非 基 类 ; 36.3 节 。 
优先 选择 string 操作 而 非 C 风格 字符 串 函 数 ; 36.3.1 万 。 
以 传 值 方式 返回 string (依赖 移动 语义 ); 36.3.2 节 。 
将 string::npos 表示 “string 剩余 部 分 ”; 36.3.2 节 。 
不 要 将 nullptr 传递 给 接受 C 风格 字符 串 的 string 函数 ; 36.3.2 节 。 
string 可 以 按 需 增长 和 收缩 ; 36.3.3 节 。 
[10 ] 当 需 要 进行 范围 检查 时 ,使 用 at() 而 非 迭 代 咒 或 []; 36.3.3 节 ，36.3.6 广 。 
[11] 当 需 要 优化 速度 时 ， 使 用 迭代 器 或 [而 非 at(); 36.3.3 节 ，36.3.6 市 。 
[ 12 ] 如 果 使 用 string， 应 在 程序 某 些 地 方 捕获 length_error 和 out_ of _range; 36.3.3 节 。 
[13 ] 〈 仅 ) 在 必要 时 ， 用 c_str() 生成 string 的 C 风格 字符 串 表示 ; 36.3.3 节 。 
[14] string 输入 是 类 型 敏感 的 且 不 会 溢出 ; 36.3.4 节 。 
[15] 优先 选择 string_stream 或 通用 的 值 抽取 函数 (例如 to<X>) 而 非 直接 使 用 str* 
系列 数值 转换 函数 ; 36.3.5 节 。 
[ 16 ] 使 用 find() 操作 在 string 中 定位 元 素 (而 不 是 自己 编写 循环 ); 36.3.7 节 。 
[17 ] 直接 或 间接 使 用 substr() 读 取 子囊 ， 用 replace() 写 人 子 串 ; 36.3.8 节 。 
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如 果 代 码 和 注释 不 一 致 ， 
则 可 能 两 者 都 错 了 。 
一 一 诺 姆 : 施 赖 尔 


e 正则 表达 式 
正则 表达 式 符号 表示 
e@ regex 
匹配 结果 ; 格式 化 
e 正则 表达 式 函 数 
regex_match(); regex_search(); regex_replace() 
e 正则 表达 式 迭 代 器 
regex_iterator; regex_token_iterator 
e@ regex_traits 
。 建议 


37.1 正则 表达 式 


在 <regex> 中 ， 标 准 库 提 供 了 对 正则 表达 式 的 支持 : 
e regex_match(): 匹配 正则 表达 式 和 (已 知 长 度 的 ) 字符 串 。 
e regex_search(): 在 一 个 〈 任 意 长 的 ) 数据 流 中 搜索 匹配 正则 表达 式 的 字符 串 。 
e regex_replace(): 在 一 个 (任意 长 的 ) 数据 流 中 搜索 匹配 正则 表达 式 的 字符 串 并 替换 
它们 
e regex_iterator: 用 来 遍历 匹配 结果 和 子 匹 配 的 迭代 器 。 
e regex_token_iterator: 用 来 遍历 未 匹配 部 分 的 迭代 器 。 
regex_search() 的 集合 是 一 组 匹配 集合 ， 通 常 表示 为 一 个 smatch: 


void use() 

{ 
ifstream in("file.txt"); /输入 文件 
if (lin) cerr << "no file\n™; 


regex pat {R"(\Ww{2M\s*\d{5}(~\d{4})?)"}; // 美国 邮政 编码 模式 


int lineno = 0; 
for (string line; getline(in,line);) { 
++linenoi 
smatch matches; /匹配 的 字符 串 保 存在 这 里 
if (regex_search(line, matches, pat)) { 
cout << lineno << ":"<< matches[0] << "\n';”// 完整 匹配 结果 
if (1<matches.size() && matches[1].matched) 
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cout <<"\t: "<< matches{1] << "\n';// 子 匹配 
} 
} 

} 
这 个 函数 读 取 一 个 文件 ， 从 中 查找 美国 邮政 编码 ， 例 如 TX77845 和 DC 20500-0001。 
smatch 类 型 就 是 保存 正则 表达 式 匹配 结果 的 容器 。 在 本 例 中 ，matches[0] 保存 完整 的 匹 
配 结果 ，matches[1] 保存 可 选 的 四 数字 子 模式 。 在 本 例 中 我 使 用 了 裸 字 符 串 字面 常量 ( 见 
7.3.2.1 节 )， 它 特别 适合 正则 表达 式 ， 因 为 正则 表达 式 中 会 包含 大 量 反 斜 线 。 假 如 我 使 用 普 
通 字 符 串 字面 常量 ， 模 式 定义 就 必须 写成 : 

regex pat {"\\Ww{2}\\sxWd{5}(-\Wd{4})?"}; 。”// 美国 邮政 编码 模式 


正则 表达 式 语法 和 语义 的 设计 目标 是 令 正则 表达 式 能 编译 为 状态 机 并 高 效 执行 [Cox, 2007]。 
类 型 regex 在 运行 时 完成 这 种 编译 。 


37.1.1 正则 表达 式 符号 表示 


regex 库 支持 多 种 正则 表达 式 符号 表示 方式 ( 见 37.2 节 )。 在 此 ， 我 首先 介绍 默认 的 符 
号 表示 一 一 用 于 ECMAscript (更 常用 的 名 称 是 JavaScript) 的 ECMA 标准 的 一 种 变 体 。 
正则 表达 式 的 语法 基于 特殊 含义 字符 : 





正则 表达 式 特殊 字符 


任意 单个 字符 (“通配符 ” ) \ 下 一 个 字符 有 特殊 含义 
[ 字符 类 开始 零 次 或 多 次 重复 

] 字符 类 结束 兴 一 次 或 多 次 重复 

{ 指定 次 数 重复 开始 ? 可 选 ( 零 次 或 一 次 ) 

} 指定 次 数 重复 结束 | 二 选 一 (或 运算 ) 

( 分 组 开始 六 行 开始 ; 表示 否定 

) 分 组 结束 $ 行 结束 


例如 ， 我 们 可 以 指定 一 个 模式 是 以 零 个 或 多 个 A 开始 一 行 ， 后 接 一 个 或 多 个 B， 最 后 是 一 个 
可 选 的 C 结束 这 行 : 


“A*B+C?$ 

下 面 这些 字 符 串 与 此 模式 匹配 : 
AAAAAAAAAAAABBBBBBBBBC 
BC 
B 

下 面 这 些 字符 串 与 此 模式 不 匹配 : 
AAAAA 1// 没 有 B 

AAAABC 咱 多 了 前 导 空格 

AABBCC 儿 多 于 一 个 C 

模式 的 一 个 组 成 部 分 如 果 被 括号 所 包围 ， 则 它 构 成 一 个 子 模式 (可 从 smatch 中 独立 抽取 

出 来 )。 


通过 添加 后 级 ， 可 以 指定 一 个 模式 是 可 选 的 或 是 重复 多 次 的 (默认 只 出 现 一 次 ): 





重复 
{n} 严格 重复 n 次 
{n,} 重复 n 次 或 更 多 次 
{n,m} 至 少 重复 n 次 , 最 多 m 次 
零 次 或 多 次 ， 即 ，{0,} 
+ 一 次 或 多 次 ， 即 ，{1,} 
有 可 选 的 ( 零 次 或 一 次 )， 即 ，{0,1} 
例如 下 面 的 正则 表达 式 : 
A{3}B{2,4}C* 
下 面 两 个 字符 串 与 之 匹配 : 
AAABBC 
AAABBB 
下 面 几 个 字符 串 与 之 不 匹配 : 
AABBC /1 A 太 少 
AAABC // B 太 少 


AAABBBBBCCC /1/B 太 多 
如 果 在 任何 重复 符号 之 后 放 一 个 后 级 ?， 会 使 模式 匹配 器 变 得 “懒惰 ”或 者 说 “不 贪心 ”。 
即 ， 当 查找 一 个 模式 时 ， 会 查找 最 短 匹 配 而 非 最 长 匹配 。 而 默认 情况 下 ， 模 式 匹配 器 总 是 查 
找 最 长 匹配 (类似 C++ 的 最 长 匹配 法 则 ，Max Munch rule; 见 10.3 节 )。 考 虑 下 面 的 字符 串 : 


ababab 
模式 (ab) * 匹配 整个 字符 串 ababab ， 而 (ab) *? 只 匹配 第 一 个 ab。 
下 表 列 出 了 最 常用 的 字符 集 : 
字符 集 
alnum 任意 字母 数字 字符 
alpha 任意 字母 字符 
blank 任意 空白 符 ， 但 不 能 是 行 分 隔 符 
cntrl 任意 控制 字符 
d 任意 十 进 制 数字 
digit 任意 十 进 制 数 字 
graph 任意 图 形 字符 
lower 任意 小 写字 符 
print 任意 可 打印 字符 
punct 任意 标点 
s 任意 空白 符 
space 任意 空白 符 
upper 任意 大 写字 符 
Ww 任意 单词 字符 (字母 数字 字符 再 加 上 下 划 线 ) 
xdigit 任意 十 六 进 制 数字 


一 些 字 符 集 还 支持 简写 表示 : 
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字符 集 简写 


\d 
\s 
Ww 
\D 
\S 
\W 


一 个 十 进 制 数字 [[:digit:]] 
一 个 空白 符 (空格 、 制 表 符 等 等 ) [[:space:]] 
一 个 字母 (a-z) 或 数字 (0-9) 或 下 划 线 (_) L[:alnum:]] 
除 \d 之 外 的 字符 [A[:digit]] 
除 \s 之 外 的 字符 [‘[:space:]] 
除 \w 之 外 的 字符 [^[:alnum:]] 


此 外 ， 支 持 正 则 表达 式 的 语言 通常 还 提供 如 下 字符 集 简 写 : 


\ 


\u 
\L 


\U 


非 标准 (但 常见 的 ) 字符 集 简写 


-个 小 写字 符 [[:lower:]] 
一 个 大 写字 符 [[:upper:]] 
除 \ 之 外 的 字符 [^[:lower:]] 
除 \u 之 外 的 字符 [^[:upper:]] 


为 了 保证 可 移植 性 ， 应 使 用 完整 的 字符 集 名 而 不 是 简写 。 

考虑 这 样 一 个 例子 : 编写 一 个 模式 ， 描 述 C++ 标识 符 一 一 以 一 个 下 划 线 或 字母 开头 ， 
后 接 一 个 由 字母 、 数 字 或 下 划 线 组 成 的 序列 (可 以 是 空 序列 )。 为 了 展示 其 中 的 微妙 之 处 ， 
下 面 给 出 一 些 错误 的 模式 : 


[:aipha:][:alnum:]* 
[[:alpha:]l[[:alinum:]]#* 


儿 错误: 表示 字符 集 应 该 在 外 边 再 加 上 中 括号 对 
儿 错 误 : 没有 接受 下 划 线 ('' 不 是 字母 ) 


([[:alpha:J]l )[f:ainum:]]* 儿 错误 : 下划线 不 属于 字母 数字 
{[[:alpha:]]l_)([[:atnum:]]]_ )* lI 正确 ， 但 太 笨拙 了 
ff:alpha:]_]f[:alnum:] _]* // 正确 : 在 字符 集中 包含 了 下 划 线 
[L_ [:aipha:]][L_[:alinum:]]* /变换 了 顺序 ， 也 是 正确 的 


L {:alpha:]]\w* 


li\w 等 价 于 [_[:alnum:]] 


最 后 ， 下 面 的 函数 用 最 简单 的 regex_match() 版 本 ( 见 37.3.1 节 ) 来 检查 一 个 字符 串 是 否 是 
一 个 标识 条 


bool is_identifier(const string& s) 


{ 


} 


regex pat {"[ [:alpha:]]\w:"); 
return regex_match(s,pat); 


注意 ， 使 用 两 个 反 斜 线 是 为 了 在 一 个 普通 字符 串 字 面 常量 中 包含 一 个 普通 反 斜 线 字 符 。 而 通 
常情 况 下 ， 反 和 斜 线 用 来 表示 下 一 个 字符 有 特殊 含义 : 


\xhh 
\uhhhh 


特殊 字符 (iso.2.14.3，6.2.3.2 节 ) 
换行 
制 表 符 
一 个 反 斜 线 
用 两 位 十 六 进 制 数 表 示 的 Unicode 字符 
用 四 位 十 六 进 制 数 表 示 的 Unicode 字符 


对 于 反 斜 线 ，regex 库 还 提供 了 另外 两 种 逻辑 上 不 同 的 用 途 ， 这 进一步 增加 了 混 靖 的 可 能 : 
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”特殊 字符 (is0.28.52,3722 节 ) 





\b 一 个 单词 的 首 字 符 或 尾 字符 (“边界 字符 ”) 
\B 非 \b 的 字符 
Ni 模式 中 第 i 个 sub_match 


使 用 裸 字符 串 字面 常量 可 缓解 很 多 特殊 字符 问题 ， 例 如 : 


bool is_identifier(const string& s) 

{ 
regex pat {R"([L_[:alpha:]]\w:)"}; 
return regex_match(s,pat); 


} 
下 面 是 一 些 模式 的 例子 : 


Ax* I A, Ax, AXXXX 

Ax+ ll Ax, Axxx A 不 匹配 

\d-?\d /1 1-2, 12 1--2 不 匹配 
\w{2}-\d{4,5} /Ab-1234, XX-54321, 22-5432 ”数字 也 属于 \w 
(dx:)?(\d+) /1112:3, 1:23, 123, :123 123: 不 匹配 


(bs|BS) llbs, BS bs 不 匹配 

[aeiouy] lla,o,u 英语 元 音字 母 ，x 不 匹配 
[aeiouy] /1 x, k 非 元 音字 母 ，e 不 匹配 
[a‘eiouy] lla,^, o,u 元 音字 母 或 ^ 


在 一 个 正则 表达 式 中 ， 被 括号 限定 的 部 分 形成 一 个 group 〈 子 模式 )， 通 过 sub_match 来 表 
示 。 如 果 你 需要 用 括号 但 又 不 想 定义 一 个 子 模式 ， 则 应 使 用 (? 而 不 是 普通 的 (。 例 如 : 
(\s|:|,)s(vd*) /空白 符 、 冒 号 或 逗号 ， 后 接 一 个 数 
假设 我 们 对 数 之 前 的 字符 不 感 兴趣 (可 能 是 分 隔 符 )， 则 可 写成 : 
(?\s|:|,)s(vds) /空白 符 、 冒 号 或 过 号 ， 后 接 一 个 数 


这 样 ， 正 则 表达 式 引擎 就 不 必 保 存 第 一 个 字符 : (? 使 得 只 有 数字 部 分 才 是 子 模式 。 


正则 表达 式 分 组 例子 
\d*\s\w+ 无 分 组 ( 子 模式 ) 
(\d*)\s(\w+) 两 个 分 组 
(\d*)(\s(\w+))+ 两 个 分 组 (分 组 不 支持 嵌 套 ) 
(\s*\w*)+ 一 个 分 组 ,但 有 一 个 或 多 个 子 模式 ; 只 有 最 后 一 个 子 模式 保存 为 一 个 sub_match 
<(.*?)>(.*?)<A1> 三 个 分 组 ;\1 表示 “与 分 组 1 一 样 ” 


最 后 一 个 模式 对 于 XML 文件 的 解析 很 有 用 。 它 可 以 查找 标签 起 始 和 结束 的 标记 。 注 意 ， 对 
标签 起 始 和 结束 间 的 子 模式 ， 我 使 用 了 非 贪心 匹配 (懒惰 匹配 ) .*?。 假 如 我 使 用 普通 的 匹配 
策略 “， 下 面 这 个 输入 就 会 导致 问题 : 


Always look for the <b>bright</b> side of <b>life</b>. 


如 果 对 第 一 个 子 模式 采用 贪心 匹配 策略 ， 则 会 将 第 一 个 < 与 最 后 一 个 > 配对 。 而 对 第 二 个 
子 模式 采用 贪心 匹配 策略 则 将 第 一 个 <b> 与 最 后 一 个 </b> 配对 。 两 者 都 是 正确 的 ， 但 结果 
也 许 不 是 程序 员 所 期 望 的 。 

我 们 可 以 用 可 选项 ( 见 37.2 节 ) 来 改变 正则 表达 式 符号 表示 的 细节 。 例 如 ， 如 果 使 用 regex_ 
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constants::grep， 则 a?x:y 是 一 个 五 个 普通 字符 的 序列 ， 因 为 在 grep 语法 中 ? 不 表示 “可 选 ” 


的 含义 。 


有 关 正 则 表达 式 更 为 详尽 的 介绍 ， 请 参阅 [Friedl, 1997]。 


37.2 regex 


正则 表达 式 就 是 从 字符 序列 (如 string) 构造 的 一 个 匹配 引擎 (matching engine， 通 常 


是 一 个 状态 机 ): 


template<class C, class traits = regex_traits<C>> 
class basic_regex { 


public: 


using value type = C; 

using traits_type = traits; 

using string_type = typename traits::string_type; 

using flag_type = regex_constants::syntax_option_type; 
using locale_type = typename traits::locale_type; 


“basic_regex();// 非 虚 函 数 ; basic regex 不 被 用 作 基 类 


1... 
}; 


regex_traits 将 在 37.5 节 中 介绍 。 
类 似 string，regex 是 使 用 char 的 特例 化 版 本 的 别名 : 


Using regex = basic_regex<char>; 


正则 表达 式 模式 的 含义 由 syntax_option_type 常量 控制 ，regex_constants 和 regex 中 都 有 
其 定义 ， 两 个 定义 是 等 价 的 : 


icase 
nosubs 
optimize 
collate 
ECMAScript 
basic 
extended 
awk 

grep 

egrep 


basic_regex<C,Tr> 成 员 常 量 ( syntax_option_type，iso.28.5.1 ) 
匹配 时 不 区 分 大 小 写 

在 匹配 结果 中 不 保存 子 表达 式 

优先 选择 快速 匹配 而 非 快速 正则 表达 式 对 象 构造 

[a-b] 形式 的 字符 范围 是 区 域 敏感 的 

正则 表达 式 语法 采用 ECMA-262 中 ECMAScript 所 使 用 的 语法 (有 微小 改动 ; iso.28.13 ) 
正则 表达 式 语法 为 POSIX 中 使 用 的 基本 正则 表达 式 

正则 表达 式 语法 为 POSIX 中 使 用 的 扩展 正则 表达 式 

正则 表达 式 语法 为 POSIX awk 所 使 用 的 语法 

正则 表达 式 语法 为 POSIX grep 所 使 用 的 语法 

正则 表达 式 语法 为 POSIX grep -E 所 使 用 的 语法 


除非 你 有 充分 的 理由 ， 否 则 请 使 用 默认 设置 。“ 充 分 ”的 理由 包括 让 已 有 的 大 量 非 默认 表示 
方式 的 正则 表达 式 能 正确 工作 。 
我 们 可 以 从 一 个 string 或 类 似 的 字符 序列 构造 regex 对 象 : 


basic_regex r 1; 


basic_regex<C,Tr> 构造 函数 (iso.28.8.2 ) 
默认 构造 函数 : 构造 一 个 空 模式 ; 标志 设置 为 regex_constants:: ECMAScript 


basic_regex r {x,flags}; x 可 以 是 一 个 basic_regex、 一 个 string、 一 个 C 风格 字符 串 或 一 个 initializer_ 


basic_regex r {x}; 


list<value_type> ， 表 示 方 式 设置 为 flags; 显 式 构造 函数 
basic_regex{x,regex_constants::ECMAScript}; 显 式 构造 函数 
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( 续 ) 
basic_regex<C,Tr> 构造 函数 (iso.28.8.2 ) 
basic_regex r {p,n,flags}; 用 [p:p+n) 中 的 字符 构造 r， 表 示 方 式 由 flags 定义 


basic_regex r {p,n}; basic_regex{p,n,regex_constants::ECMAScript} 
basic_regex r {fb,e ,flags} 用 [b:e) 中 的 字符 构造 r， 表 示 方 式 由 flags 定义 
basic_regex r {b,e}; basic_regex{b,e ,regex_constants::ECMAScript} 


我 们 主要 通过 搜索 、 匹 配 和 替换 函数 ( 见 37.3 节 ) 来 使 用 regex， 但 regex 自身 也 提供 少量 
操作 


basic_regex<C,Tr> 操作 (iso.28.8 ) 


string 或 一 个 initializer_list<value_type> 
r=move(r2) 移动 赋值 操作 
r=r.assign(r2) 拷贝 或 移动 
r=r.assign(x,flags) 拷贝 或 移动 ; 将 r 的 标志 设置 为 flags， x 可 以 是 一 个 basic_string、 一 个 C 风格 字 


符 串 或 一 个 initializer_list<value_type> 
r=r.assign(x) r=r.assign(x,regex_constants::ECMAScript) 
r=r.assign(p,n,flags) 将 r 的 模式 设置 为 [p:p+n)， 标 志 设 置 为 flags 
r=r.assign(b,e,flags) 将 r 的 模式 设置 为 [b:e)， 标 志 设 置 为 flags 


r=r.assign(b,e) r=r.assign(b,e,regex_constants::ECMAScript) 
n=r.mark_count() n 为 中 标记 的 子 表达 式 的 数目 

x=r.flags() x 为 r 的 flags 

loc2=r.imbue(loc) 将 Fr 的 区 域 设 置 为 loc; loc2 为 r 的 旧 locale 
loc=r.getloc() loc 为 r 的 locale 

r.swap(r2) 交换 r 和 r2 的 值 


可 以 通过 调用 getloc() 获得 一 个 locale 或 regex， 以 及 通过 调用 flags() 获知 标志 是 怎样 的 ， 
但 不 幸 的 是 ， 没 有 【标准 的 ) 方法 来 读 取 模 式 。 如 果 需 要 输出 模式 ， 只 能 在 初始 化 时 保留 一 
个 副本 。 例 如 : 

regex pat1 {R"(\w+\d*)"}; /无 法 输出 patl 中 的 模式 

string s {R"(\Ww+\d*)"}; 


regex pat2 {s}; 
cout << s << \n'; 11pat2 中 的 模式 


37.2.1 匹配 结果 


正则 表达 式 匹配 的 结果 被 收集 在 一 起 ， 保 存在 一 个 match_results 对 象 中 ， 它 包含 一 个 
或 多 个 sub_match 对 象 : 


template<class Bi> 
class sub_match : public pair<Bi,Bi> { 
public: 
using value_type = typename iterator traits<Bi>::value_type; 
using difference_type = typename iterator traits<Bi>::difference_type; 
using iterator = Bi; 
using string_type = basic string<value_type>; 


} 
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bool matched; /| 若 *this 包含 一 个 匹配 ， 则 为 true 


lass 


Bi 必须 是 一 个 双向 迭代 器 ( 见 33.1.2 节 )。 一 个 sub_match 可 以 看 作 一 对 迭代 器 ， 指 向 进行 


匹配 的 字符 串 。 





sub_match sm {}; 
n=sm.length() 


Ss=SM 


s=sm.str() 
x=sm.compare(x) 


x== 
x!=y 
x<y 
x>y 
x<=y 


x>=y 


sm.matched 


例如 : 


sub_match<Bi> 操作 
默认 构造 函数 : 一 个 空 序列 ; constexpr 
n 为 匹配 的 字符 数 
sub_match 到 basic_string 的 隐 式 转换 ，s 是 一 个 包含 匹配 字符 的 basic_string 
s 是 一 个 包含 匹配 字符 的 basic_string 
字典 序 比较 : sm.str().compare(x) ; x 可 以 是 一 个 sub_match、 一 个 basic_string 或 


一 个 C 风格 字符 串 


x 等 于 y? x 和 yy 可 以 是 一 个 sub_match 或 一 个 basic_string 
!(x==y) 

在 字典 序 上 x 小 于 y? 

y<x 

!(x>y) 

!(x<y) 

若 sm 包含 一 个 匹配 ， 则 结果 为 true ， 否 则 为 false 


regex pat ("<(.*?)>(.*?)</(.*?)>"); 


string s = "Always look for the <b> bright </b> side of <b> death </b>"; 


if (regex_search(s1,m,p2)) 
if (m{1]==m[{3]) cout <<“matchn ; 


输出 为 match。 


一 个 match_results 就 是 一 个 sub_match 的 容器 : 


template<class Bi, class A = allocator<sub_match<Bi>> 
class match_results { 


public: 


}; 


using value_type = sub_match<Bi>; 

using const_reference = const value type&; 

using reference = const_reference:; 

using const_iterator = /* 由 实现 定义 */; 

using iterator = const_iterator; 

using difference_type = typename iterator_traits<Bi>::difference_type; 
using size_type = typename allocator traits<A>::size_type; 

using allocator_type = Ai; 

using char_type = typename iterator_traits<Bi>::value_type; 

using string_type = basic_string<char_type>; 


-match_results(); ”// 不 是 虚 函 数 


Me 


Bi 必须 是 一 个 双向 迭代 器 ( 见 33.1.2 节 )。 
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第 四 部 分 


准 大 








类 似 basic_string 和 basic_ostream， 标 准 库 为 最 常见 的 match_results 提供 了 一 些 标 


准 别名 : 
using cmatch = match_results<const char*>; 咱 C 风格 字符 串 
using wcmatch = match_results<const wchar t:*>; 咱 C 风格 宽 字 符 囊 
using smatch = match_results<string::const_iterator>; ll string 


using wsmatch = match_results<wstring::const iterator>; /| wstring 


match_results 提供 了 访问 其 匹配 字符 串 、sub_match 和 匹配 之 前 /之 后 字符 的 操作 : 


mio] 





| m.prefix() 


m[m.size()]| m.suffix() 


mt1] 韶 六 





match_results 也 提供 一 些 常 规 操 作 : 


match_results m {}; 


match_results m {a}; 


match_results m {m2)}; 


m2=m 
m2=move(m) 

m. match_results() 
m.ready() 
n=m.size() 
n=m.max_size() 
m.empty() 

r=m[i 


n=m.length(i) 
n=m.length() 
pos=m.position(i) 
pos=m.position() 
s=m.str(i) 
s=m.str() 
sm=m.prefix() 
sm=m.suffix() 
p=m.begin() 
p=m.end() 
p=m.cbegin() 
p=m.cend() 


a=m.get_allocator() 


m.swap(m2) 
m==m2 


m!l=m2 


regex<C,Tr> 匹配 和 子 匹配 操作 (iso.28.9，iso.28.10 ) 

默认 构造 函数 : 使 用 allocator_type{} 

使 用 分 配器 a; 显 式 构造 函数 

拷贝 和 移动 构造 函数 

拷贝 赋值 操作 

移动 赋值 操作 

析 构 函数 : 释放 所 有 资源 

m 保存 了 一 个 完整 的 匹配 结果 ? 

n-1 为 m 中 子 表达 式 的 数目 ; 车 m 中 没有 匹配 结果 ， 则 n== 

n 为 m 中 sub_match 的 最 大 可 能 数目 

m.size()==0 ? 

r 为 指向 m 的 第 i 个 sub_match 的 const 引用 ; m[0] 表示 完整 匹配 ; 若 ij>=size()， 
mii] 指向 一 个 表示 未 匹配 子 表达 式 的 sub_match 

n=mli]j.length(); mli] 的 字符 数 

n=m.length(0) 

pos=m[i].first; mli] 的 首 字符 

pos=m.position(0) 

s=m[i].str(); mli] 的 字符 串 表 示 

s=m.str(0) 

sm 是 一 个 sub_match， 表 示 输 入 字符 串 中 在 匹配 结果 之 前 的 与 m 不 匹配 的 字符 

sm 是 一 个 sub_match ， 表 示 输 入 字符 串 中 在 匹配 结果 之 后 的 与 m 不 匹配 的 字符 

p 指向 m 的 第 一 个 sub_match 

p 指向 m 的 最 后 一 个 sub_match 之 后 的 位 置 

p 指向 m 的 第 一 个 sub_match (const 迭代 器 ) 

p 指向 m 的 最 后 一 个 sub_match 之 后 的 位 置 (const 迭代 器 ) 

a 为 m 的 分 配器 

交换 m 和 m2 的 状态 

m 和 m2 的 sub_match 值 相等 吗 ? 

!(m==m2) 








我 们 可 以 对 regex_match 进行 下 标 操作 来 访问 sub_match， 例 如 ml[i]。 如 果 一 个 下 标 i 指 
向 一 个 不 存在 的 sub_match， 则 mii] 的 结果 表示 一 个 未 匹配 的 sub_match。 例 如 : 
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void test() 

{ 
regex pat ("(AAAA)(BBB)?"); 
string s = "AAAA"; 
smatch m; 
regex_search(s,m,pat); 


cout << boolaipha; 


cout << m[0].matched << "\n'; /ftrue: 我 们 找到 了 一 个 匹配 
cout << m[1].matched << \n'; /true: 存在 第 一 个 sub_match 
cout << m[2].matched << "\n'; /| false: 不 存在 第 二 个 sub_match 
cout << m[3].matched << "\n'; /1 false: pat 不 存在 第 三 个 sub_match 
} 
37.2.2 格式 化 


在 regex_replace() 中 ， 用 format() 进行 格式 化 : 





regex<C,Tr> 格式 化 (iso.28.10.5 ) 
用 match_flag_type 选项 控制 格式 化 
out=m.format(out,b,e,flags) 拷贝 [b:e) 到 out; 用 格式 字符 替换 m 中 的 子 匹 配 





out=m.format(out,b,e) out=m.format(out,b,e,regex_constants::format_default) 
out=m.format(out,fmt,flags) out=m.format(out,begin(fmt),end(fmt),flags) ; fmt 可 以 是 一 个 basic_string 
或 一 个 C 风格 字符 串 
out=m.format(out,fmt) out=m.format(out,fmt,regex_constants::format_default) 
s=m.format(fmt,flags) s 构造 为 fmt 的 一 个 拷贝 ; 用 格式 字符 替换 m 中 的 子 匹 配 ; fmt 可 以 是 一 个 
basic_string 或 一 个 C 风格 字符 串 
s=m.format(fmt) s=m.format(fmt,reg ex_constants::format_default) 
格式 串 中 可 以 包含 格式 化 字符 : 
格式 化 替换 符号 
$& 匹配 部 分 
$ 前 组 部 分 
$ 后 缀 部 分 
$i 第 i 个 子 匹 配 ， 如 $1 
$ii 第 计 i 个 子 匹配 ， 如 $12 
$$ 不 表示 匹配 ， 表 示 普 通 字符 $ 


示例 请 见 37.3.3 节 。 
format() 进行 格式 化 的 细节 是 由 一 组 选项 (标志 ) 控制 的 : 


regex<C,Tr> 格式 化 选项 (regex_constants::match_flag_type; iso.28.5.2 ) 





format_default 使 用 ECMAScript (ECMA-26 ) 规则 ( 见 iso.28.1.3 ) 
format_sed 使 用 POSIX sed 符号 表示 
format_no_copy 只 拷贝 匹配 结果 


format first_only 只 有 正则 表达 式 第 一 次 出 现 的 匹配 才 被 拷贝 


37.3 正则 表达 式 函 数 


regex 库 提 供 了 一 些 将 正则 表达 式 模式 应 用 于 数据 的 函数 ， 其 中 regex_search() 用 
于 在 字符 序列 中 搜索 模式 ，regex_match() 用 于 匹配 固定 长 度 的 字符 序列 ， 而 regex_ 
replace() 用 于 替换 模式 。 

匹配 操作 的 细节 由 一 组 选项 (标志 ) 控制 : 


regex<C,Tr> 匹配 操作 (regex_constants::match_flag_type; iso.28.5.2 ) 


match_not_bol 字符 ^ 不 被 认为 是 “ 行 开始 ”的 含义 
match_not_eol 字符 $ 不 被 认为 是 “ 行 结束 ”的 含义 

match_not _bow \b 不 匹配 子 序列 [first:first) 

match_not_eow \b 不 匹配 子 序列 [last:last) 

match_any 如 果 存 在 多 于 一 个 匹配 ， 则 任何 一 个 都 是 可 接受 的 
match_not_null 不 匹配 空 序列 

match_continuous 只 匹配 从 first Ee 

match_prev_avail --first 是 一 个 合法 的 迭代 器 位 置 


37.3.1 regex_match() 
为 了 查找 与 已 知 长 度 的 完整 序列 (例如 一 行文 本 ) 匹配 的 模式 ， 可 使 用 regex_match(): 


正则 表达 式 匹 配 (iso.28.11.2 ) 
匹配 由 match_flag_type 选项 控制 ( 见 37.3 节 ) 


从 : 7 将 结果 存 . 洗 
ee 输入 [b:e) 匹配 regex 模式 pat ? 将 结果 存 人 match_results m; 使 用 选 


项 flags 
regex_match(b,e,m,pat) regex_match(b,e,m,pat,regex_constants::match_default) 
regex_match(b,e,pat,flags) 输入 [b:e) 匹配 regex 模式 pat ? 使 用 选项 flags 
regex_match(b,e,pat) regex_match(b,e,pat,regex_constants::match_default) 
reg ex_match(x,m,pat,flags) 输入 x 匹配 regex 模式 pat? x 可 以 是 一 个 basic_string 或 一 个 C 风格 字 
符 串 ; 将 结果 存 人 match_results m; 使 用 选项 flags 
regex_match(x,m,pat) regex_match(x,m,pat,regex_constants::match_default) 
regex_match(x,pat,flags) 输入 x 匹配 regex 模式 pat ? x 可 以 是 一 个 basic_string 或 一 个 C 风格 字 
符 串 ; 使 用 选项 flags 
regex_match(x,pat) regex_match(x,pat,regex_constants::match_default) 


例如 ， 考 虑 一 个 朴素 的 程序 ， 它 验证 一 个 表格 的 格式 。 如 果 表 格格 式 合乎 要 求 ， ee 
“all is well ”到 cout ; 否则 会 将 错误 消息 输出 到 cerr。 一 个 表格 由 若干 行 组 成 ， 每 行 包含 
个 由 制 表 符 分 隔 的 字段 ， 第 一 行 (标题 行 ) 除外 ， 第 一 行 可 能 只 有 三 个 字段 。 te 


Class Boys Girls Total 


1a 12 15 27 
1b 16 14 30 
Total 28 29 57 


每 行 每 列 的 数值 都 已 累加 ， 结 果 放 在 最 后 一 列 和 最 后 一 行 。 
程序 首先 读 取 标题 行 ， 然 后 读 取 每 行 数值 并 进行 累加 ， 直 至 到 达 最 后 一 行 “ Total” 
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int main() 

{ 
ifstream in("table.txt"); /输入 文件 
if (!in) cerr << "no file\n"; 


string line; ”/ 儿 / 输 入 缓冲 区 
int lineno = 0; 


regex header {R"(Tw J+(\thw J+)*$)"}; 1 制 表 符 间隔 的 单词 
regex row {R"( (Ww ]+)(tid+)(td+)(Wtid+)$)"}; /1/ 一 个 标签 后 接 制 表 符 分 隔 的 三 个 数值 


if (getline(in,line)) { // 检查 并 丢弃 标题 行 
smatch matches; 
if (Iregex_match(line,matches,header)) 
cerr << "no header\n"; 


} 
int boys = 0; /数值 总 计 
int girls = 0; 
while (getline(in,line)) { 
++lineno; 
smatch matches; 儿子 匹配 保存 在 这 里 
if (tregex_match(line,matches,row)) 
cerr << "bad line: "<< lineno << "\n'; 
int curr_boy = stoi(matches[2]); 儿 关 于 stoi() 见 36.3.5 节 
int curr_girl = stoi(matches[3]); 
int curr_total = stoi(matches[4]); 
if (curr_boy+curr_girl != curr_total) cerr << "bad row sum \n"; 
if (matches{1]=="Total") { 川 最 后 一 行 
if (curr_boy != boys) cerr << "boys do not add up\n"; 
if (curr_girl != girls) cerr << “girls do not add up\n"; 
cout << "all is well\n"; 
return 0; 
} 
boys += curr_boy; 
girls += curr_girl; 
} 


cerr << "didn't find total line\n") 
return 1; 


} 
37.3.2 regex_ search() 


为 了 在 序列 (如 一 个 文件 ) 中 查找 一 个 模式 ， 可 使 用 regex_search(): 


正则 表达 式 搜索 (iso.28.11.3 ) 
匹配 由 match_flag_type 选项 控制 ( 见 37.3 节 ) 
regex_search(b,e,m,pat,flags) 输入 [b:e) 包含 匹配 regex 模式 pat 的 部 分 ? 将 结果 存 人 match_results 
m; 使 用 选项 flags 
regex_search(b,e,m,pat) regex_match(b,e,m,pat,regex_constants::match_default) 
regex_search(b,e,pat,flags) 输入 [b:e) 包含 匹配 regex 模式 pat 的 部 分 ? 使 用 选项 flags 


172 入 四 万 分 丰 准 座 


( 续 ) 
正则 表达 式 搜索 (iso.28.11.3 ) 

regex_search(b,e,pat) regex_search(b,e,pat,regex_constants::match_default) 
regex_ search(x,m,pat,flags) 输入 x 包含 匹配 regex 模式 pat 的 部 分 ? x 可 以 是 一 个 basic_string 或 一 

个 C 风格 字符 串 ; 将 结果 存 人 match_results m; 使 用 选项 flags 
regex_search(x,m,pat) regex_search(x,m,pat,regex_constants::match_default) 
regex_search(x,pat,flags) 输入 x 包含 匹配 regex 模式 pat 的 部 分 ? x 可 以 是 一 个 basic_string 或 一 

个 C 风格 字符 串 ; 使 用 选项 flags 
regex_search(x,pat) regex_search(x,pat,regex_constants::match_default) 


例如 ， 我 可 以 像 下 面 这 样 查找 我 的 名 字 的 一 些 常见 拼写 错误 : 

regex pat {"[Ss]tro?u?v?p?stra?0?u?p?b?"}); 

smatch mi; 

for (string s; cin>>s; ) 

if (regex_search(s,m,pat)) 
if (m{0]!="stroustrup” && mif0]!="Stroustrup”) 
cout << "Found: " << m[0] << "\n'; 

给 定 一 些 输入 ， 这 段 代码 会 输出 Stroustrup 的 错误 拼写 ， 例 如 : 


Found: strupstrup 
Found: Strovstrup 
Found: stroustrub 
Found: Stroustrop 


注意 ， 即 使 模式 “隐藏 ”在 其 他 字符 中 间 ，regex_search() 也 能 找到 。 例 如 ， 它 能 找到 
abstrustrubal 中 的 strustrub。 如 果 你 希望 模式 匹配 整个 字符 串 ， 应 使 用 regex_match() ( 见 
37.3.1 节 )。 


37.3.3 regex_replace() 
为 了 替换 序列 (例如 一 个 文件 ) 中 匹配 模式 的 部 分 ， 可 使 用 regex_replace(): 


正则 表达 式 替 换 (iso.28.11.4 ) 
匹配 由 match_flag_type 选项 控制 ( 见 37.3 节 ) 
out=regex_replace(out,b,e,pat,fmt,flags) “在 [b:e) 中 搜索 regex 模式 pat， 拷 贝 到 out ; 车 在 序列 中 找到 匹 
配 pat 的 部 分 ， 按 fmt 指出 的 格式 将 其 拷贝 到 out ; flags 控制 pat 
如 何 匹 配 以 及 fmt 如 何 影响 拷贝 模式 ; fmt 可 以 是 一 个 basic_string 
或 一 个 C 风格 字符 串 
out=regex_replace(out,b,e,pat,fmt) out=regex_replace(out,b,e,pat,fmt, regex_constants::match_defaults) 
s=regex_replace(x,pat,fmt,flags) 在 x 中 搜索 regex 模式 pat, 拷贝 到 s ; 若 在 序列 中 找到 匹配 pat 
的 部 分 ， 按 fmt 指出 的 格式 将 其 拷贝 到 out ; flags 控制 pat 如 何 匹 
配 以 及 fmt 如何 影响 拷贝 模式 ; x 可 以 是 一 个 basic_string 或 一 个 
C 风格 字符 串 ; fmt 可 以 是 一 个 basic_string 或 一 个 C 风格 字符 串 


s=regex_replace(x,pat,fmt) s=regex_replace(x,pat,fmt,regex_constants::match_defaults) 


格式 拷贝 是 用 regex 的 format() 实现 的 ( 见 37.2.2 节 )， 它 采用 $ 前 级 符 号， 例如 ，$& 表示 
完整 匹配 ，$2 表示 第 二 个 子 匹 配 。 下 面 是 一 个 小 的 测试 程序 ， 它 接受 一 个 单词 和 数值 对 组 
成 的 字符 串 ， 按 每 行 一 对 { 单词 ， 数 值 } 的 格式 输出 : 
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void test1() 

{ 
string input {"x 1 y2 22 zaq 34567"}); 
regex pat {"(\w+)\s(\d+)"}; 儿 单词 空白 符 数值 
string format {"{$1,$2}n"}; 


cout << regex_replace(input,pat,format); 


} 
这 个 测试 函数 会 输出 : 

{x,1} 

{y2,22} 

{zaq,34567} 
注意 行 首 恼人 的 空格 。 上 默认 情况 下 ，regex_replace() 会 将 未 匹配 的 字符 拷贝 到 其 输出 目标 ， 
因此 ， 与 pat 不 匹配 的 两 个 空格 会 被 打印 出 来 。 

为 了 去 掉 这 类 空白 符 ， 我 们 可 以 使 用 format_no_copy 选项 ( 见 37.2.2 节 ): 


cout << regex_replace(input,pat,format,regex_constants::format_no_copy); 


{xX,1} 
{y2,22} 
{zaq,34567} 
子 匹 配 不 一 定 按 顺序 输出 : 
void test2() 
{ 
string input {"x 1y 2z 3"); 
regex pat {"(\w)\s(\d+)"}; // 单词 空白 符 数值 
string format {"$2: $1\n"}; 
现在 ， 输 出 变 为 : 
1: x 
22: y2 
34567: zeq 


37.4 正则 表达 式 和 迭代 器 


regex_search() 函数 允许 我 们 在 数据 流 中 查找 给 定 模式 的 第 一 次 出 现 。 如 果 我 们 和 希望 
查找 模式 出 现 的 所 有 位 置 并 对 这 些 匹 配 执行 一 些 操 作 ， 又 该 如 何 做 呢 ? 如 果 数 据 组 织 为 容易 
识别 的 行 或 记录 的 序列 ， 我 们 可 以 遍历 这 些 行 或 记录 ， 并 对 它们 应 用 regex_match()。 如 果 
我 们 希望 简单 地 替换 模式 的 每 个 匹配 ， 则 可 使 用 regex_replace()。 如 果 我 们 希望 遍历 一 个 
字符 序列 ， 对 模式 的 每 个 匹配 执行 一 些 操作 ， 则 可 使 用 regex_iterator。 


37.4.1 regex_iterator 


一 个 regex_iterator 实质 上 是 一 个 双向 迭代 器 。 当 递增 它 时 ， 会 在 序列 中 搜索 模式 的 下 
一 个 匹配 : 
template<class Bi， 
class C = typename iterator traits<Bi>::value_type， 
class Tr = typename regex_traits<C>::type> 
class regex_iterator { 
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public: 
using regex_type = basic_regex<C,Tr>; 
using value_type = match_results<Bi>; 
using difference type = ptrdiff fi; 
using pointer = const value type*; 
using reference = const value_type&i 
using iterator_category = forward_iterator_tag; 
Mi 


} 
regex_traits 将 在 37.5 节 中 介绍 。 
regex 库 提供 了 常用 的 别名 : 


using cregex_iterator = regex_iterator<const char*>; 

using wcregex_iterator = regex_iterator<const wchar t*>; 

using sregex_iterator = regex_iterator<string::const _iterator>; 
using wsregex_iterator = regex_iterator<wstring::const_iterator>; 


regex_iterator 支持 最 低 限 度 的 迭代 器 操作 : 


regex_iterator<Bi,C, Tr> (iso.28.12.1 ) 


regex_iterator p {1}; p 为 序列 尾 

regex_iterator p {b,e,pat,flags}; 遍历 [b:e)， 查 找 匹 配 pat 的 部 分 ， 匹 配方 式 由 flags 控制 
regex_iterator p {b,e,pat} p 初始 化 为 {b,e,pat,regex_constants::match_default} 
regex_iterator p {q}; 拷贝 构造 函数 (无 移动 构造 函数 ) 

p=q 拷贝 赋值 操作 (无 移动 赋值 操作 ) 

pe==q p 与 gq 指 向 相同 的 sub_match ? 

pl=q !(p==q) 

c=*p c 为 当前 的 sub_match 

x=p->m x=(*p).m 

++p 令 p 指 向 其 模式 的 下 一 个 出 现 位 置 

qd=p++ q=p， 然 后 ++p 


regex_iterator 适 配 双向 迭代 器 ， 因 此 我 们 不 能 直接 遍历 istream。 
我 们 以 下 面 的 程序 为 例 ， 它 输出 一 个 string 中 所 有 以 空白 符 分 隔 的 单词 : 


void test() 
{ 


string input = "aa as; asd ++e'"asdf asdfg"; 

regex pat {R"(\s+(\w+))")}; 

for (sregex_iterator p(input.begin(),input.end(),pat); p!=sregex_iterator{}; ++p) 
cout << (*p)[1] << "\n'; 


} 
此 程序 输出 : 


as 
asd 
asdfg 


注意 ， 我 们 遗漏 了 第 一 个 单词 aa， 因 为 它 没 有 前 导 空白 符 。 如 果 我 们 将 模式 简化 为 R"((\ 
ew+))"， 则 得 到 : 


aa 
as 
asd 
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e 
asdf 
asdfg 


不 能 通过 一 个 regex_iterator 写 和 人 数据。 此 外 ，regex_iterator{} 唯一 表示 序列 尾 。 


37.4.2 regex_ token iterator 


我 们 可 以 用 regex_iterator 遍历 查找 到 的 match_results 的 sub_match, regex_token_ 
iterator 是 其 适配器 : 


template<class Bi, 
class C = typename iterator traits<Bi>::value_type, 
class Tr = typename regex_traits<C>::type> 
class regex_token_iterator { 
public: 
Using regex_type = basic_regex<C,Tr>; 
using value_type = sub_match<Bi>; 
using difference_type = ptrdiff_t; 
using pointer = const value_type*:; 
using reference = const value_type&i; 
Using iterator_category = forward_iterator tag; 
Wm 


regex_traits 将 在 37.5 节 中 介绍 。 
regex 库 提供 了 常用 的 别名 : 


using cregex_ token_iterator = regex_token_iterator<const char*>; 

using wcregex_token_iterator = regex_token_iterator<const wchar t:*>; 

using sregex_token_iterator = regex_token_iterator<string::const_iterator>; 
using wsregex_token_iterator = regex_token_iterator<wstring::const_iterator>; 


regex_token_iterator 支持 最 低 限 度 的 迭代 器 操作 





regex_token_iterator (iso.28.12.2 ) 
regex_token_iterator p 人 }; p 为 序列 尾 
regex_token_iterator p {b,e,pat,x,flags}; x 列 出 了 要 遍历 的 sub_match 的 下 标 ， 若 为 0， 表 示 “ 完 整 匹 配 ”， 
若 为 -1， 表 示 “ 未 匹配 的 不 在 sub_match 中 的 每 个 字符 序列 ”; x 可 
以 是 一 个 int、 一 个 initializer_list<int>、 一 个 const vector<int>& 或 
一 个 const int (&sub_match)[N] 


regex_token_iterator p {b,e,pat,x}; p 初始 化 为 {b,e,pat,x,regex_constants::match_default} 
regex_token_iterator p {b,e,pat}; p 初始 化 为 {b,e,pat,0,regex_constants::match_default} 
regex_iterator p {q}; 拷贝 构造 函数 (无 移动 构造 函数 ) 
p.-regex_token_iterator() 析 构 函数 : 释放 所 有 资源 

p=q 拷贝 赋值 操作 (无 移动 赋值 操作 ) 

p==q p 与 9 指向 相同 的 sub_match ? 

pl=q !(p==q) 

c=*p c 为 当前 的 sub_match 

x=p->m x=(*p).m 

++p 令 p 指 向 其 模式 的 下 一 个 出 现 位 置 

q=p++ q=p， 然 后 ++p 





实 参 x 列 出 了 要 遍历 的 sub_match。 例 如 (遍历 子 匹配 1 和 3): 





void test1() 
{ 
string input {"aa::bb cc::dd ee::ff")}; 
regex pat {R"((\Ww+)([[:punct:]]+)(\w+)\s*)"); 
sregex_token_iterator end {}; 
for (sregex_token iterator p{input.begin(),input.end(),pat,{1,3}}; pl=end; ++p) 
cout << *p << \n’; 


} 
此 程序 将 输出 


选项 -1 会 反 转 报告 匹配 结果 的 策略 ， 它 表示 要 遍历 未 匹配 ， 即 不 在 sub_match 中 的 每 个 字 
符 序列 。 这 通常 被 称 为 单词 splitting ( token splitting， 即 ， 将 字符 流 切 分 成 单词 )， 因 为 当 你 
的 模式 匹配 单词 分 隔 符 时 ， 选 项 -1 就 会 令 你 得 到 单词 。 例 如 : 


void test2() 
{ 
string s {"1,2, 3 ,4,5, 6 7"); // 输入 
regex pat {R"(\s*,\s*)"}; 咱 用 逗号 作为 单词 分 隔 符 


copy(sregex_token_ iterator{s.begin(),s.end(),pat,—1)}, 
sregex_token_iterator{}, 
ostream_iterator<string>{cout,"\n"}); 


} 
这 段 程序 会 输出 : 


入 WD 


5 
67 
可 以 改 成 等 价 的 循环 版 本 : 
void test3() 
{ 
sregex_token_iterator end{}; 
for (sregex_token_iterator p {s.begin(),s.end(),pat,-1}; p!=end; ++p) 
cout << *p << "\n'; 


} 


37.5 regex_ traits 
regex_traits 根据 regex 实现 者 的 需要 将 一 个 字符 类 型 、 一 个 字符 串 类 型 和 一 个 区 域 设 
置 关联 起 来 : 


template<class C> 
struct regex_traits { 
public: 
using char_type = C; 
using string_type = basic_string<char_type>; 
using locale_type = locale; 
using char_class_type =/* 由 具体 实现 定义 的 位 掩 码 类 型 "/; 
hisss 
}; 
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标准 库 提供 了 两 个 特例 化 版 本 regex_traits<char> 和 regex_traits<wchar-t>。 


regex_traits<C> 操作 (iso.28.7 ) 


regex_traits tr {}; 构造 默认 regex_traits<C> 

n=length(p) n 为 C 风格 字符 串 中 p 的 字符 数 ; n=char_traits<C>::length(); 静态 函数 

c2=tr.translate(c) c2=c， 即 空 操 作 

c2=tr.translate_nocase(c) use facet<ctype<C>>(getloc()).tolower(c); 见 39.4.5 节 

s=tr.transform(b,e) s 是 一 个 字符 串 ， 可 用 来 将 [b:e) 与 其 他 字符 串 进行 比较 ; 见 39.4.1 节 

s=tr.transform_primary(b,e) s 是 一 个 字符 串 ， 可 用 来 将 [b:e) 与 其 他 字符 串 进行 比较 ; 忽略 大 小 写 ; 
见 39.4.1 节 

s=tr.lookup_collatename(b,e) 车 有 合法 的 对 照 元 素 对 应 字符 序列 [b:e)， 则 s 为 其 字符 串 名 ,否则 s 为 
空 字 符 串 


m=tr.lookup_classname(b,e,ign) “对 于 字符 序列 [b:e) 对 应 的 字符 类 别 ，m 为 其 类 别 掩 码 的 字符 串 名 ; 若 
ign==true 则 忽略 大 小 写 





m=tr.lookup_classname(b,e) m=tr.lookup_classname(b,e,false) 

tr.isctype(c,m) c 的 字符 类 别 为 m ? m 是 一 个 class_type 
i=tr.value(c,b) i 为 c 所 表示 的 b 进 制 数值 ; b 必须 是 8、10 或 16。 
loc2=tr.imbue(loc) 将 tr 的 区 域 设置 设 定 为 loc; loc2 为 tr 的 旧 区 域 设置 
loc=tr.getloc() loc 为 tr 的 区 域 设置 


在 实现 模式 匹配 时 ， 为 了 进行 快速 比较 ,会 用 transform() 生成 字符 串 。 
字符 类 别名 就 是 37.1.1 节 中 列 出 的 字符 类 别 之 一 ， 例 如 alpha、a 和 xdigit。 


37.6 建议 


[1] 将 regex 用 于 正则 表达 式 的 大 部 分 常规 用 途 ; 37.1 节 。 

[2] 我 们 可 以 调整 正则 表达 式 符号 表示 ， 来 适应 不 同 的 标准 ; 37.1.1 节 ，37.2 节 。 
[3] 默认 正则 表达 式 符号 表示 为 ECMAScript; 37.1.1 节 。 

[4 ] 出 于 可 移植 性 考虑 ， 使 用 字符 类 别 符 号 表示 来 避免 非 标准 的 简写 ; 37.1.1 节 。 
[5] 使 用 正则 表达 式 要 注意 节制 ， 它 很 容易 变 成 一 种 难 读 的 语言 ;37.1.1 节 。 
[6] 优先 选择 裸 字符 串 字 面 常量 描述 模式 〈 最 简单 的 模式 除外 ) 37.1.1 节 。 

[7] 注意 ,Ni 符号 允许 你 用 之 前 的 子 模式 来 描述 后 面 的 一 个 子 模式 ; 37.1.1 节 。 
[8] 用 ? 令 模式 的 匹配 采用 “懒惰 ”策略 ; 37.1.1 节 ，37.2.1 节 。 

[9] regex 可 以 使 用 ECMAScript、POSIX、awk、grep 和 egrep 符号 表示 ; 37.2 节 。 
[10] 保存 模式 字符 串 的 一 份 副本 ， 以 备 你 需要 输出 它 时 使 用 ; 37.2 节 。 

[11] 用 regex_search() 在 字符 流 中 查找 模式 ， 用 regex_match() 查找 特定 字符 串 ; 
7 3373 和 节 
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输出 流 和 缓冲 区 ; 输入 流 和 缓冲 区 ; 缓冲 区 迭代 器 
e 建议 


38.1 引言 


IO 流 库 提供 了 文本 和 数值 的 输入 输出 功能 ， 这 种 输入 输出 是 带 缓冲 的 ， 可 以 是 格式 化 
的 ， 也 可 以 是 未 格式 化 的 ,1/0 流 工具 定义 在 <istream>、<ostream> 等 头 文件 中 ; 见 30.2 节 。 
ostream 将 有 类 型 的 对 象 转换 为 字符 流 ( 字 节 流 ): 


有 类 型 值 : 字 节 序列 : 









ostream “ 某 处 ” 
istream 将 字符 流 ( 字 节 流 ) 转换 为 有 类 型 的 对 象 : 
有 类 型 值 : 字 节 序列 : 
[| 
[ (123,45) | 


iostream 就 是 既 可 作为 istream 使 用 也 可 作为 ostream 使 用 的 流 。 上 图 中 的 缓冲 区 为 流 缓 
冲 区 (streambufs ; 见 38.6 节 )， 当 你 定义 iostream 到 新 型 设备 、 文 件 或 内 存 的 映射 时 ， 需 
要 用 到 缓冲 区 。istream 和 ostream 上 的 操作 将 在 38.4.1 节 和 38.4.2 节 中 进行 介绍 。 

如 果 只 是 使 用 流 库 ， 那 么 不 必 了 解 其 实现 技术 的 细节 。 因 此 在 本 书 中 我 只 介绍 理解 和 使 
用 iostream 所 必需 的 一 般 思想 。 如 果 你 需要 实现 标准 流 、 提 供 一 种 新 的 流 或 是 提供 一 种 新 
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的 区 域 设 置 ， 那 么 在 本 章 介绍 的 内 容 之 外 ， 你 还 需要 一 份 C++ 标准 库 的 副本 、 一 本 很 好 的 
系统 手册 以 及 实现 代码 实例 。 
流 式 IO 系统 的 关键 组 件 可 以 图 形 化 表示 如 下 : 


ios_base: basic_streambuf<>: 
区 域 无 关 的 格式 状态 缓冲 


























下 A 
basic_ios<>: 郊 | | 真实 目的 / 源 | 
区 域 相关 的 格式 状态 流 状 态 1 ET 


basic iostream<>: locale: 
格式 化 (<<，>> 等 ) 格式 信息 


设置 /清除 








实 线 表 示 “ 派 生 自 ”， 虚 线 表 示 “ 指 向 ”。 带 <> 标记 的 类 是 用 字符 类 型 参数 化 并 包含 locale 
的 模板 。 
IO 流 操作 有 如 下 特性 : 
e 类 型 安全 日 类 型 敏感 ; 
e 可 扩展 ( 当 某 人 设计 了 一 个 新 类 型 ， 可 以 添加 相配 的 IO 流 运算 符 而 无 须 修改 已 有 代 
码 ); 
e 区 域 敏 感 ( 见 第 39 章 ); 
e 高 效 (虽然 具体 C++ 实现 并 不 总 是 能 实现 它们 的 全 部 潜力 ); 
e 能 与 C 风格 标准 输入 输出 互 操 作 ( 见 43.3 节 ); 
。 包含 格式 化 的 、 非 格式 化 的 以 及 字符 级 的 操作 。 
basic iostream 是 基于 basic_istream ( 见 38.6.2 节 ) 和 basic_ostream ( 见 38.6.1 节 ) 定 
义 的 : 
template<typename C, typename Tr = char traits<C>> 
class basic iostream : 
pubilic basic_istream<C,Tr>, public basic_ostream<C,Tr> { 
public: 
using char type = C; 
using int {ype typename Tr::int_type; 
using pos_type = typename Tr::pos_type; 


using off_type = typename Tr::off_type; 
using traits_type = Tr; 


explicit basic_iostream(basic_streambuf<C,Tr>* sb); 
virtual -basic_iostream(); 

protected: 
basic_iostream(const basic_iostream& rhs) = delete; 
basic_iostream(basic_ iostream&& rhs); 


basic_iostream& operator=(const basic_iostream& rhs) = delete; 
basic_iostream& operator=(basic_iostream&& rhs); 
void swap(basic_iostreama& rhs); 


}; 
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模板 参数 指定 字符 类 型 ， 茜 取 则 用 来 操纵 字符 ( 见 36.2.2 节 )。 

注意 ，LO 流 不 提供 拷贝 操作 : 复杂 流 状 态 的 共享 或 克隆 很 难 实现 ， 使 用 代价 也 很 高 。 
移动 操作 是 供 派生 类 使 用 的 ， 因 此 是 protected 的 。 移 动 一 个 iostream 而 不 移动 它 定义 的 
派生 类 (如 fstream) 的 状态 会 导致 错误 。 








共有 8 种 标准 流 : 
标准 库 IO 流 

cout 标准 字符 输出 (通常 默认 为 屏幕 ) 
cin 标准 字符 输入 (通常 默认 为 键盘 ) 
cerr 标准 字符 错误 输出 (无 缓冲 ) 
clog 标准 字符 错误 输出 (有 缓冲 ) 
wcin cin 的 wistream 版 本 
wcout cout 的 wostream 版 本 
wcerr cerr 的 wostream 版 本 
wclog clog 的 wostream 版 本 


流 类 型 和 流 对 象 的 前 置 声明 都 在 <iosfwd> 中 。 


38.2 ”1/0O 流 层 次 


一 个 istream 可 以 连接 到 一 个 输入 设备 (如 键盘 )、 一 个 文件 或 一 个 string。 类 似 地 ， 一 
个 ostream 可 以 连接 到 一 个 输出 设备 (如 一 个 文本 窗口 或 一 个 HTML 引擎 )、 一 个 文件 或 一 
个 string。1/O 流 特性 组 织 为 一 个 类 层次 : 


ios_base 
basic_ios<> 
me ps 
basic_istream<> basic_ostream<> 
basic_istringstream<> basic_iostream<> basic_ostringstream<> 


oo ace 


basic fstream<> basic_stringstream<> 


带 <> 后 纹 的 类 是 用 字符 类 型 参数 化 的 版 本 。 虚 线 表示 虚 基 类 ( 见 21.3.5 节 )。 

关键 的 类 是 basic_ios， 其 中 定义 了 大 多 数 实现 和 很 多 操作 。 但 是 ， 大 多 数 漫不经心 的 
(和 不 那么 漫不经心 的 ) 用 户 永远 也 不 会 看 到 它 : 它 很 大 程度 上 属于 流 的 实现 细节 。 我 将 在 
38.4.4 节 中 介绍 它 ， 它 的 大 多 数 特性 将 在 介绍 其 功能 时 进行 介绍 (如 格式 化 ; 见 38.4.5 节 )。 


38.2.1 文件 流 


在 <fstream> 中 ， 标 准 库 提供 了 读 写 文件 的 流 : 
e ifstream 用 于 从 文件 读 取 数据 ，; 

e ofstream 用 于 向 文件 写 人 数据 ; 

e fstream 用 于 读 写 文件 。 
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文件 流 遵循 共同 的 模式 ， 因 此 我 只 介绍 fstream : 


template<typename C, typename Tr=char traits<C>> 
class basic_fstream 
: public basic_iostream<C,Tr> { 
public: 
Using char type = C; 
using int type = typename Tr::int_type; 


using pos_type = typename Tr::pos_type; 外 表示 文件 中 的 位 置 
using off_type = typename Tr::off type; /表示 文件 中 的 偏 移 


using traits_type = Tr; 
Hf sa 
} 


fstream 的 操作 非常 简单 : 


basic_fstream<C,Tr> (iso.27.9 ) 





fstream fs {}; fs 是 一 个 文件 流 ， 未 与 文件 关联 

fstream fs {s,m}; fs 是 一 个 文件 流 ， 关 联 到 名 为 s 的 文件 ， 打 开 模 式 为 m ; s 可 以 是 一 个 string 或 
一 个 C 风格 字符 串 

fstream fs {fs2}; 移动 构造 函数 : fs2 被 移动 到 fs; fs2 不 再 与 文件 关联 

fs=move(fs2) 移动 赋值 操作 : fs2 被 移动 到 fs; fs2 不 再 与 文件 关联 

fs.swap(fs2) 交换 fs 和 fs2 的 状态 

p=fs.rdbuf() p 是 一 个 指针 ， 指 向 fs 的 文件 流 缓冲 区 (basic_filebuf<C,Tr>) 

fs.is_open() fs 已 打开 ? 


以 模式 m 打开 名 为 s 的 文件 ， 并 令 fs 指向 它 ; 若 无 法 打开 文件 ,设置 fs 的 failbit ; 
s 可 以 是 一 个 string 或 一 个 C 风格 字符 串 
fs.close() 关闭 fs 关联 的 文件 (如果 存 在 的 话 ) 


fs.open(s,m) 


此 外 ,文件 流 覆 盖 了 basic_ios 的 保护 虚 函 数 underflow()、pbackfail()、overflow()、setbuf()、 
seekoff() 和 seekpos() ( 见 38.6 节 )。 

文件 流 不 提供 拷贝 操作 。 如 果 你 希望 两 个 名 字 指 向 同一 个 文件 流 ， 可 使 用 引用 或 指针 或 
是 小 心 操 纵 文 件 的 streambuf ( 见 38.6 节 )。 

如 果 fstream 打开 失败 ， 流 会 进入 bad() 状态 ( 见 38.3 节 )。 

<fstream> 中 定义 了 6 个 文件 流 别名 : 


Using ifstream = basic_ifstream<char>; 

using wifstream = basic_ifstream<wchar_ft>; 
using ofstream = basic_ofstream<char>; 
Using wofstream = basic_ ofstream<wchar _t>; 
using fstream = basic fstream<char>; 

using wfstream = basic_fstream<wchar_t>; 


ios_base 中 定义 了 多 种 文件 打开 模式 ( 见 38.4.4 节 ): 


流 模 式 (iso.27.5.3.1.4 ) 





ios_base::app 追加 ( 即 ， 添 加 到 文件 尾 ) 
ios_base::ate “尾部 ” (打开 文 件 并 定位 到 文件 尾 ) 
ios_base::binary 二 进 制 模式 ; 要 小 心 系统 相关 的 行为 
ios_base::in 读 

os_base::out 过 





ios_base::trunc 截断 文件 一 一 长 度 变 为 0 
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对 于 每 种 模式 ， 打 开 文件 的 确切 效果 可 能 依赖 于 操作 系统 。 如 果 操 作 系统 不 允许 一 个 请 求 以 
某 种 方式 打开 一 个 文件 ， 会 导致 流 进 入 bad() 状态 ( 见 38.3 节 )。 例 如 : 


ofstream ofs("target"); J1“o” 表 示 ” 输 出 ”， 意 味 着 ios::out 
if (!ofs) 

error("couldn't open ‘target' for writing"); 
fstream ifs; 1/“i” 表 示 ” 输 入 ”， 意 味 着 ios::in 
ifs.open("source",ios base::in); 
if (!ifs) 


error("couldn't open 'source' for reading"); 


文件 定位 的 相关 内 容 请 见 38.6.1 节 


38.2.2 ”字符 串 流 


在 <sstream> 中 ,标准 库 提供 了 读 写 string 的 流 : 
e istringstream 用 于 从 string 读 取 数据 ; 
e ostringstream 用 于 向 string 写 和 人 数据 ; 
e stringstream 用 于 读 写 string。 
字符 串 流 遵循 共同 的 模式 ， 因 此 我 只 介绍 stringstream : 


template<typename C, typename Tr = char_traits<C>, typename A = allocator<C>> 
class basic_stringstream 

: public basic_iostream<C,Tr> { 
public: 

using char type = C; 

using int_ type = typename Tr::int type; 

using pos_type = typename Tr::pos_type;  // 表 示 string 中 的 位 置 

using off_type = typename Tr::off_type; // 表 示 string 中 的 偏 移 

using traits_type = Tr; 

using allocator type = A; 


1... 
stringstream 的 操作 有 : 


basic_stringstream<C,TrA> (iso.27.8 ) 


stringstream ss {m}; ss 是 一 个 空 字符 串 流 ， 打 开 模 式 为 m 

stringstream ss {}; 默认 构造 函数 : stringstream ss {ios_base::outlios_base::in}; 

stringstream ss {s,m}; ss 是 一 个 字符 串 流 ， 其 缓冲 区 用 string s 以 模式 m 进行 初始 化 

stringstream ss {Ss}; stringstream ss {Ss,ios_base::outlios_base::in}; 

stringstream ss {ss2}; 移动 构造 函数 : ss2 被 移动 到 ss; ss2 变 为 空 

ss=move(ss2) 移动 赋值 操作 : ss2 被 移动 到 ss; ss2 变 为 空 

p=ss.rdbuf() p 指向 ss 的 字符 串 流 缓冲 区 (一 个 basic_stringbuf<C,Tr,A>) 

s=ss.str() s 是 一 个 字符 串 ， 保存 ss 中 字符 的 副本 : s=ss.rdbuf()->str() 

ss.str(s) ss 的 缓冲 区 用 string s 进 行 初始 化 : s=ss.rdbuf()->str(); 若 ss 的 模式 为 
ios::ate (“尾部 ”)， 写 到 ss 的 值 添加 到 来 自 s 的 字符 之 后 ， 否 则 覆盖 来 自 s 的 字符 

ss.swap(ss2) 交换 ss 和 ss2 的 状态 


我 将 在 38.4.4 节 中 介绍 打开 模式 。istringstream 的 默认 打开 模式 为 ios_base::in，ostringstream 
的 默认 打开 模式 为 ios_base::out。 
此 外 ， 字 符 串 流 覆 盖 了 basic_ios 的 保护 虚 函 数 underflow()、pbackfail()、overflow()、 
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setbuf()、seekoff() 和 seekpos() ( 见 38.6 节 )。 
字符 串 流 不 提供 拷贝 操作 。 如 果 你 希望 两 个 名 字 指 向 同一 个 字符 串 流 ， 可 使 用 引用 或 指针 。 
<sstream> 中 定义 了 6 个 文件 流 别名 : 


using istringstream = basic_istringstream<char>; 

using wistringstream = basic_istringstream<wchar _t>; 
Using ostringstream = basic_ostringstream<char>; 
Using wostringstream = basic_ostringstream<wchar_ft>; 
using stringstream = basic_stringstream<char>; 

using wstringstream = basic_stringstream<wchar_t>; 


例如 : 
void test() 
{ 
ostringstream oss {"Label: ",ios::ate}; /在 尾部 写 
cout << oss.str() << \n'; /| 输出 "Label:" 
oss<<"val"; 
cout << oss.str() << \n'; /输出 "Label: val" ("val" 追加 在 "Label:" 之后) 
ostringstream oss2 {"Label: "); 川 在 头 部 写 
cout << oss2.str() << \n'; // 输出 "Label:" 
oss2<<"val"; 
cout << 0Ss2.str() << \n';// 输出 "valel:" ("val" 覆盖 了 "Label: ") 
} 


只 有 当 需 要 从 一 个 istringstream 读 取 结果 时 ， 我 才 会 使 用 str()。 
我 们 不 可 能 直接 输出 一 个 字符 串 流 ， 必 须 借助 str(): 


void test2() 


{ 

istringstream iss; 

iss.str("Foobar ); 川 填写 iss 

cout << iss << "\n'; 放 输 出 1 

cout << iss.str() << \n'; ，/W/ 正 确 : 输出 "Foobar" 
} 


第 一 条 输出 语句 会 输出 1， 这 可 能 有 点 儿 令 人 吃惊 ， 其 原因 是 iostream 被 转换 成 了 其 当前 
状态 以 便 用 于 检测 : 


if (iss){ /liss 的 最 后 一 个 操作 成 功 了 ; 其 状态 为 good() 或 eof() 
ll... 


} 
else{ 

儿 处理 问题 
} 


38.3 ”错误 处 理 
一 个 iostream 在 某 个 时 刻 会 处 于 四 种 状态 之 一 ， 这 些 状态 的 定义 来 自 于 <ios> 的 basic_ 
ios 中 ( 见 38.4.4 节 ): 


流 状态 (iso.27.5.5.4 ) 


good() 前 一 个 iostream 操作 成 功 
eof() 到 达 输 入 尾 (“ 文 件 尾 ”) 
fail() 发 生 了 出 乎 意料 的 事情 (例如,， 读 取 数 组 却 得 到 一 个 'x') 


bad() 发 生 了 出 乎 意料 的 严重 事情 (例如 ， 磁 盘 读 错误 ) 
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如 果 一 个 流 不 在 good() 状态 ， 对 它 的 任何 操作 都 没有 效果 ， 即 相当 于 空 操作 。 一 个 
iostream 可 以 作为 一 个 条 件 来 使 用 : 若 iostream 的 状态 为 good()， 则 条 件 为 真 (成 功 )。 人 
们 编写 从 流 中 读 取 数据 的 代码 时 ， 习 惯 于 以 此 为 基础 : 
for (X x; cin>>x;) { // 读 取 类 型 为 X 的 值 存 入 输入 缓冲 区 
放 ... 对 x 执行 一 些 操作 .. 


} 
儿 当 >> 无 法 继续 从 cin 获得 X 时 会 执行 到 这 里 
若 读 取 失败 ， 我 们 或 许可 以 清除 流 状态 ， 继 续 读 取 : 
int i; 
if (cin>>i) { 
1 ..…. 使 用 i.. 
} else if (cin.fail()){ /可 能 是 格式 错误 
cin.clear(); 
string s; 
让 (cin>>s){ /我们 或 许 能 读 取 一 个 string 来 从 错误 中 恢复 
/| .使 用 s .… 
} 
} 


我 们 也 可 以 使 用 异常 来 处 理 错 误 : 


异常 控制 : basic_ ios<C,Tr> ( 38.4.4 节 ，iso.27.5.5 ) 
st=ios.exceptions() st 为 ios 的 iostate 


ios.exceptions(st) 将 ios 的 iostate 设置 为 st 





例如 ， 我们 可 以 令 cin 在 其 状态 被 设置 为 bad() 时 (例如 ， 通 过 cin.setstate(ios_base::badbit)) 
抛 出 一 个 basic_ios::failure: 


cin.exceptions(cin.exceptions()lios_base::badbit); 





例如 : 

struct lo_guard { /用 于 iostream 异常 的 RAII 类 
iostream& s; 
auto old_e = s.exceptions(); 
lo_guard(iostream& ss, ios_base::iostate e) :s{ss} { s.exceptions(s.exceptions()|e); } 
“lo_guard() { s.exceptions(old_e); } 

}; 

void usel(istream& is) 
lo_guard guard(is.ios_base::badbift); 
// … 使 用 褒 … 

} 

catch (ios_base::badbit) { 
1// … 摆脱 困境 ! .… 

} 


我 倾向 于 使 用 异常 来 处 理 那些 我 不 奢望 能 恢复 的 iostream 错误 。 这 通常 意味 着 捕获 的 都 是 
一 些 bad() 异常 。 


38.4 1/O 操作 
IO 操作 的 复杂 性 反映 了 习惯 沿革 、 对 I/O 性 能 要 求 以 及 人 们 各 种 各 样 的 需求 。 本 节 介 
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绍 的 内 容 基 于 常规 的 英语 小 字符 集 (ASCII) 。 处 理 不 同 字 符 集 和 不 同 自然 语言 的 方法 将 在 第 
39 章 介绍 。 


38.4.1 输入 操作 


输入 操作 由 istream 提供 ， 除 了 那些 读 取 数 据 存 人 string 的 操作 外 ， 其 他 操作 都 定义 在 
<istream> 中 。basic_istream 主要 作为 更 专用 的 输入 类 (如 istream 和 istringstream) 的 基 类 : 


template<typename C, typename Tr = char traits<C>> 
class basic_istream : virtual public basic_ios<C,Tr>{ 
public: 

using char type = C; 

using int_type = typename Tr::int_type:; 

using pos_type = typename Tr::pos_type; 

using off_type = typename Tr::off_type:; 

using traits_type = Tr; 


explicit basic_istream(basic_streambuf<C,Tr>* sb); 
virtual “basic_istream(); // 释放 所 有 资源 


class sentry; 
ls 
protected: 
咱 有 移动 操作 但 无 拷贝 操作 : 
basic_istream(const basic_istream& rhs) = delete; 
basic_istream(basic istream&& rhs); 
basic_istream& operator=(const basic_istream& rhs) = delete; 
basic_istream& operator=(basic istream&& rhs); 
fi 
}; 
对 istream 的 用 户 而 言 ，sentry 类 属于 库 的 实现 细节 。 它 为 标准 库 输入 操作 和 用 户 自 定义 输 
和 人 操作 提供 了 公用 代码 。 那 些 需 要 首先 执行 的 代码 (“前 缀 代码 ”) 一 一 例如 刷新 连接 的 流 的 
代码 一 一 是 以 sentry 的 构造 函数 的 方式 提供 的 。 例 如 : 
template<typename C, typename Tr = char traits<C>> 
basic_ostream<C,Tr>& basic_ostream<C,Tr>::operator<<(int i) 


{ 
sentry s {*this}; 
if (1s) { /检查 是 否 一 切 均 已 就 绪 ， 可 以 开始 输出 
setstate(failbit); 
return *this; 
} 
1/ 输出 int... 
return *this; 
} 


sentry 是 供 输入 操作 的 实现 者 而 非 其 用 户 使 用 的 。 
38.4.1.1 格式 化 输入 
格式 化 输入 功能 主要 由 << (“输入 ”、“ 获 取 ” 或 “提取 ”) 运算 符 提 供 : 


格式 化 输入 (iso.27.7.2.2，iso.21.4.8.9 ) 
in>>x 根据 x 的 类 型 从 in 读 取 数 据 ， 存 人 x; x 可 以 是 一 种 算术 类 型 、 一 个 指针 、 一 个 basic_string、 
一 个 valarray、 一 个 basic_streambuf 或 任意 一 种 用 户 提供 了 适合 的 operator>>() 的 类 型 
getline(in,s) 从 in 读 取 一 行 存 人 string s 中 
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istream (以 及 ostream) 是 “了 解 ” 内 置 类 型 的 ， 因 此 x 如 果 是 一 个 内 置 类 型 ，cin>>x 意 
味 着 cin.operator>>(x)。 如 果 x 是 一 个 用 户 自 定义 类 型 ，cin>>x 意味 着 operator>>(cin,x) 
( 见 18.2.5 节 )。 即 ，iostream 输入 是 类 型 敏感 的 、 天 生 类 型 安全 的 且 可 扩展 的 。 新 类 型 的 设 
计 者 可 提供 相应 的 IO 操作 而 无 需 直 接 访问 iostream 的 实现 。 

如 果 将 一 个 函数 指针 作为 >> 的 目标 ， 则 该 函数 会 被 调用 ，istream 作为 实 参 传递 给 它 。 
例如 ，cin>>pf 会 调用 pf(cin)。 这 是 skipws 这 类 输入 操纵 符 的 基础 ( 见 38.4.5.2 节 )。 输 出 
流 操 纵 符 比 输 入 流 操纵 符 更 常用 ， 因 此 我 将 在 38.4.3 节 中 进一步 介绍 其 相关 技术 。 

除非 特殊 说 明 ， 否 则 一 个 istream 操作 会 返回 其 istream 的 引用 ， 因 此 我 们 可 以 将 输入 
操作 “ 串 接 ”起 来 。 例 如 : 


template<typename T1, typename T2> 
void read_pair(T1& x, T2& y) 


{ 
cin >> c1 >> x >> c2 >> yY >> C3; 
if (ct1="€ || c2!="," | c31="}) { /不 可 恢复 的 输入 格式 错误 
cin.setstate(ios base::badbit); 咱 设置 badbit 
throw runtime_error("bad read of pair"); 
} 
} 


默认 情况 下 >> 会 略 过 空白 符 。 例 如 : 


for (int i; cin>>i && 0<i;) 
cout <<i << \n 


这 段 代码 读 取 由 空白 符 分隔 的 正 整数 序列 并 分 行 输出 它们 。 

我 们 可 以 用 noskipws 禁止 跳 过 空白 符 ( 见 38.4.5.2 节 )。 

输入 操作 都 不 是 virtual 的 。 即 ， 一 个 用 户 不 能 期 望 对 一 个 基 类 执行 in>>base， 就 能 将 
>> 自动 解析 为 恰当 派生 类 上 的 操作 。 但 是 ， 有 一 种 简单 的 技术 可 以 实现 这 种 行为 ， 见 38.4.2.1 
节 。 而 且 ， 我们 还 可 以 扩展 这 种 技术 ,实现 从 输入 流 读 取 任 意 类 型 的 对 象 ， 见 22.2.4 节 。 
38.4.1.2 未 格式 化 输入 

未 格式 化 输入 可 用 来 精细 控制 数据 读 取 ， 而 且 可 能 对 提高 性 能 有 帮助 。 未 格式 化 输入 的 
一 个 用 途 是 实现 格式 化 输入 : 


未 格式 化 输入 (iso.27.7.2.3 ) 


x=in.get() 从 in 读 取 一 个 字符 ， 返 回 其 整数 值 ; 到 达 文 件 尾 时 返回 EOF 

in.get(c) 从 in 读 取 一 个 字符 存 人 c 

in.get(p,n,t) 从 in 读 取 最 多 n 个 字符 存 入 [p:…); 将 t 当 作 结束 符 

in.get(p,n) in.get(p,n,'\n') 

in.getline(p,n,t) 从 in 读 取 最 多 n 个 字符 存 人 [p:…); 将 t 当 作 结 束 符 ;将 结束 符 从 in 中 删除 
in.getline(p,n) in.getline(p,n,\n') 

in.read(p,n) 从 in 读 取 最 多 n 个 字符 存 信 [p:.…) 

x=in.gcount() x 为 in 上 最 近 一 次 未 格式 化 输入 读 取 的 字符 数 

in.putback(c) 将 c 退 回 in 的 流 缓冲 区 

in.unget() 退回 一 个 字符 到 in 的 流 缓冲 区 ， 这 样 ， 读 取 的 下 一 个 字符 将 与 上 一 个 字符 一 样 
in.ignore(n,d) 从 in 读 取 字 符 并 丢弃 ， 直 至 已 读 取 n 个 字符 或 读 取 到 (并 丢弃 了 ) d 
in.ignore(n) in.ignore(n,traits::eof()) 

in.ignore() in.ignore(1 ,traits::eof()) 


in.swap(in2) 交换 in 和 in2 的 值 
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如 果 情 况 允 许 ， 应 尽量 选择 格式 化 输入 ( 见 38.4.1.1 节 ) 而 不 是 这 些 底层 输入 函数 。 

当 需 要 将 字符 转换 为 数值 时 ， 简 单 的 get(c) 会 很 有 用 。 另 一 个 get() 函数 和 getline() 函 
数 读 取 一 个 字符 序列 并 存 入 固定 大 小 的 区 域 [p:.….)。 这 两 个 函数 一 直 读 取 字 符 ， 直 至 达到 数 
量 上 限 或 发 现 结束 符 (默认 为 \n')。 它 们 会 在 保存 的 字符 序列 尾 (如 果 有 的 话 ) 放置 一 个 0 ; 
getline() 将 结束 符 (如 果 遇 到 的 话 ) 从 输入 流 中 删除 ， 而 get() 则 不 会 。 例 如 : 

ey /底层 的 、 旧 式 的 行 读 取 方 式 


char word[MAX_WORD][MAX_LINE]; /MAX_WORD 个 数组 ， 每 个 最 多 MAX_LINE 个 字符 
inti = 0; 
while(cin.getline(word[it++],MAX_LINE,"\n') && i<MAX WORD) 

让 什么 也 不 做 */， 


Ws 

} 
对 于 这 些 函 数 ， 是 什么 终止 了 输入 并 不 是 那么 明显 : 

。 我 们 遇 到 了 结束 符 。 

。 我 们 读 取 的 字符 数 达 到 了 上 限 。 

。 我 们 到 达 了 文件 尾 。 

。 遇 到 了 非 格式 错误 。 
后 两 种 情况 可 以 通过 查看 文件 状态 〈 见 38.3 节 ) 来 处 理 。 通 常 ， 这 些 情况 的 恰当 处 理 方式 有 
相当 大 的 差异 。 

read(p,n) 在 读 取 字 符 存 人 数组 后 不 会 追加 写 一 个 0。 显 然 ， 格 式 化 输入 运算 符 比 未 格 
式 化 输入 更 简单 也 更 不 容易 出 错 。 

下 列 函数 依赖 于 流 缓冲 〈 见 38.6 节 ) 与 实际 数据 源 间 的 交互 细节 ， 因 此 只 应 在 必要 时 使 
用 ， 且 应 非常 小 心地 使 用 。 


未 格式 化 输入 (iso.27.7.2.3 ) 


x=in.peek() x 为 当前 输入 字符 ; x 不 是 从 in 的 流 缓冲 区 提取 的 ， 下 一 次 字符 读 取 会 得 到 它 

n=in.readsome(p,n) 若 rdbuf()->in_avail()==-1， 调 用 setstate(eofbit); 否则 ， 读 取 最 多 
min(n,rdbuf()->in_avail()) 个 字符 存 入 [p:…); n 为 读 取 的 字符 数 

x=in.sync() 同步 缓冲 区 : in.rdbuf()->pubsync() 

pos=in.tellg() pos 为 in 的 读 取 指针 的 位 置 

in.seekg(pos) 将 in 的 读 取 指 针 设 置 到 位 置 pos 

in.seekg(off,dir) 将 in 的 读 取 指针 在 方向 dir 上 移动 偏 移 off 


38.4.2 输出 操作 


输出 操作 由 ostream 提供 ( 见 38.6.1 节 )， 除 了 那些 输出 到 string 的 操作 外 (定义 在 
<string> 中 )， 其 他 操作 都 定义 在 <ostream> 中 : 


template<typename C, typename Tr = char traits<C>> 
class basic_ostream : virtual public basic_ios<C,Tr>{ 
public: 

using char type = Ci; 

using int _ type = typename Tr::int_type; 

using pos_type = typename Tr::pos_type:; 

using off type = typename Tr::off_type; 

using traits_type = Tr; 


explicit basic_ostream(basic_ streambuf<char type,Tr>* sb); 
virtual "basic_ostream(); // 释放 所 有 资源 


class sentry;”// 见 38.4.1 节 
Hs 
protected: 


咱 有 移动 操作 但 无 拷贝 操作 : 

basic_ostream(const basic ostream& rhs) = delete; 
basic_ostream(basic_ostream&& rhs); 

basic_ostream& operator=(basic_ ostream& rhs) = delete; 
basic_ostream& operator=(const basic_ostream&& rhs); 
Ns: 


其 
ostream 提供 格式 化 输出 、 未 格式 化 输出 (字符 输出 ) 和 简单 的 streambuf 操作 ( 见 38.6 节 )。 


输出 操作 (iso.27.7.3.6，iso.27.7.3.7，iso.21.4.8.9 ) 
Out<<x 根据 x 的 类 型 将 x 写 到 out ; x 可 以 是 一 种 算术 类 型 、 一 个 指针 、 一 个 basic_string 、 一 个 
bitset 、 一 个 complex 、 一 个 valarray 或 任意 一 种 用 户 提供 了 适合 的 operator<<() 的 类 型 
out.put(c) 将 字符 c 写 到 out 
out.write(p,n) 将 字符 [p:p+n) 写 到 out 
out.flush() 清空 输出 目标 的 字符 缓冲 区 
pos=out.tellp() pos 为 out 的 输出 指针 的 位 置 
out.seekg(pos) 将 out 的 输出 指针 设置 到 位 置 pos 
in.seekg(off,dir) ”将 out 的 输出 指针 在 方向 dir 上 移动 偏 移 off 





除非 特殊 说 明 ， 否 则 一 个 ostream 操作 会 返回 其 ostream 的 引用 ， 因 此 我 们 可 以 将 输出 操 
作 “ 串 接 ” 起 来 。 例 如 


cout << "The value of xis "<< x << "\n'; 


注意 ，char 类 型 值 以 字符 形式 而 非 小 整数 形式 输出 。 例 如 : 


void print_val(char ch) 


{ 
cout << "the value of " << ch << "is " << int{ch} << "\n’; 
} 
void test() 
{ 
print_val('a'"); 
print_val('A'); 
} 
这 段 代码 输出 : 


the value of 'a' is 97 
the value of 'A' is 65 


为 用 户 自 定义 类 型 编写 << 运算 符 通常 很 简单 : 
template<typename T> 
struct Named _ val{ 
string name; 
T value; 


}; 
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ostream& operator<<(ostream& os, const Named_val& nv) 


{ 

} 
只 要 X 定 义 了 <<， 那 么 这 段 代 码 就 能 适用 于 任何 Named_val<X>。 为 了 实现 完全 通用 ， 
basic_string<C,Tr> 必须 定义 有 <<。 
38.4.2.1 ” 虚 输 出 函数 

ostream 的 成 员 都 不 是 virtual 的 。 程 序 员 可 添加 的 输出 操作 是 非 成 员 函 数 ， 因 此 也 不 可 
能 是 virtual 的 。 输 出 操作 不 能 是 虚 函 数 的 一 个 原因 是 : 要 对 “将 一 个 字符 放 人 缓冲 区 ”这 样 
的 简单 操作 实现 接近 最 优 的 性 能 。 在 这 些 地 方 运行 时 性 能 非常 重要 ， 因 此 必须 进行 内 联 ， 这 样 
虚 函 数 就 不 可 行 了 。 虚 函数 只 被 用 来 实现 缓冲 溢出 和 向 下 溢出 的 灵活 处 理 ( 见 38.6 节 )。 

但 是 ,程序 员 有 时 希望 输出 仅 了 解 其 基 类 的 对 象 。 由 于 不 知道 确切 类 型 ， 不 能 通过 为 新 
类 型 简单 定义 << 来 实现 正确 输出 ， 而 需要 在 抽象 基 类 中 提供 虚 输 出 函数 : 


class My_base { 
public: 
Hs 
virtual ostream& put(ostream& s) const = 0; // 将 *this 写 到 s 


return os << '{’ << nv.name << ':' << nv.value << '}'; 


和 
ostream& operator<<(ostream& s, const My_base& 站 ) 


return r.put(s); // 使 用 正确 的 put() 
} 


即 ，put() 是 一 个 虚 函 数 ， 它 保证 了 在 << 中 使 用 正确 的 输出 操作 。 
有 了 这 些 定义 ， 我 们 可 以 编写 代码 如 下 : 


class Sometype : public My_base{ 
public: 
Wh 
ostream& put(ostream& s) const override; ”省 实际 输出 函数 


}; 
void f(const My_base& r, Sometype& s) /| 使 用 << 调用 正确 的 put() 
{ 
cout <<r<<s; 
} 


这 种 方法 将 虚 函 数 put() 集成 到 ostream 和 << 提供 的 框架 中 。 当 我 们 需要 提供 行为 类 似 虚 
函数 ， 但 运行 时 选择 是 基于 其 第 二 个 实 参 的 操作 时 ， 这 种 技术 通常 很 有用。 这 种 技术 类 似 一 
种 名 为 双重 分 发 ( double dispatch) 的 技术 ， 双 重 分 发 经 常 被 用 来 基于 两 种 动态 类 型 选择 操 
作 ( 见 22.3.1 节 )。 我 们 也 可 采用 类 似 技术 实现 virtual 输入 操作 ( 见 22.2.4 节 )。 


38.4.3 ”操纵 符 


如 果 向 << 传递 了 一 个 函数 指针 作为 第 二 个 实 参 ， 所 指向 的 函数 将 会 被 调用 。 例 如 ， 
cout<<pf 意味 着 pf(cout)。 这 种 函数 被 称 为 操纵 符 ( manipulator)。 接 受 参 数 的 操纵 符 很 有 
用 。 例如 : 


cout << setprecision(4) << angle; 


这 条 语句 以 四 位 数字 的 精度 打印 浮 点 变量 angle。 
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为 了 实现 这 一 目的 ，setprecision 返回 一 个 初始 值 为 4 的 对 象 并 调用 cout.precision(4)。 
这 种 操纵 符 实质 上 是 一 个 函数 对 象 ， 是 由 << 而 非 () 调用 的 。 该 函数 对 象 的 确切 类 型 是 由 具 
体 实现 定义 的 ,， 但 有 可 能 像 下 面 这 样 : 
struct smanip { 
ios_base& (sf)(ios_base&,int); 咱 调用 的 函数 
int i; 儿 使 用 的 值 
smanip(ios_base&(*ffj(ios_base&,int), int ii) :f{ff}, ifii} { } 
}; 
template<typename C, typename Tr> 
basic_ostream<C,Tr>& operator<<(basic_ostream<C,Tr>& os, const smanip& m) 


{ . 
m.f(os,m.i);  W/ 用 m 保 存 的 值 调用 m 的 f 


return os; 


} 
现在 我 们 可 以 定义 setprecision() 了 : 
inline smanip setprecision(int n) 
auto h = [](ios_base& s, int x) -> ios_base& { s.precision(x); return s; }); 
return smanip(h,n); 咱 创建 函数 对 象 
} 
为 了 返回 一 个 引用 ， 这 段 代 码 显 式 说 明了 lambda 的 返回 类 型 。 用 户 是 不 能 拷贝 ios_base 的 。 
我 们 现在 就 可 以 使 用 setprecision() 了 : 


cout << setprecision(4) << angle; 


程序 员 可 以 根据 需要 定义 smanip 风格 的 新 操纵 符 ， 为 此 你 无 需 修改 标准 库 模 板 和 类 的 
定义 。 
标准 库 操纵 符 将 在 38.4.5.2 节 中 介绍 。 


38.4.4 流 状 态 
在 <ios> 中 ， 标 准 库 定 义 了 基 类 ios_base， 它 定义 了 流 类 的 大 多 数 接口 : 


template<typename C, typename Tr = char traits<C>> 
class basic_ios : public ios_base { 
public: 
using char_type = C; 
using int_type = typename Tr::int_type; 
using pos_type = typename Tr::pos_type; 
using off_ type = Tr::off_type; 
using traits_type = Tr; 
Hl... 
}; 
类 basic_ios 管理 流 的 状态 : 
e 流 到 缓冲 区 的 映射 ( 见 38.6 节 ); 
e 格式 化 选项 ( 见 38.4.5.1 节 ); 
e locale 的 使 用 ( 见 第 39 章 ); 
e 错误 处 理 ( 见 38.3 节 ); 
e 到 其 他 流 和 C 风格 标准 输入 输出 的 连接 ( 见 38.4.4 节 )。 
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它 可 能 是 标准 库 中 最 复杂 的 类 。 
ios_base 保存 不 依赖 于 模板 实 参 的 信息 : 


class ios_base{ 
public: 


using fmtflags =/* 由 具体 实现 定义 的 类 型 */; 
using iostate = 上 * 由 具体 实现 定义 的 类 型 划 ; 
using openmode =/* 由 具体 实现 定义 的 类 型 */; 
Using seekdir =/* 由 具体 实现 定义 的 类 型 */; 


class failure; 
class Init; 


六 


/异常 类 
外 初始 化 标准 库 iostream 


上 面 代 码 中 的 “由 具体 实现 定义 的 类 型 ”都 是 掩 码 类 型 (bitmask type) ; 即 ， 它 们 支持 位 逻 
辑 运算 ， 如 & 和 1。 具体 的 例子 有 int ( 见 11.1.2 节 ) 和 bitset ( 见 34.2.2 节 )。 
ios_base 控制 iostream 到 stdio ( 见 43.3 节 ) 的 连接 (或 不 能 连接 ): 


ios_base b 分; 


ios. ios_base() 


基础 ios_base 操作 (iso.27.5.3.4 ) 
默认 构造 函数 ; 保护 函数 
析 构 函数 ; 虚 函 数 





若 b==true， 同 步 ios 和 标准 输入 输出 ; 和 否则， 共享 缓冲 区 可 能 损坏 ; b2 为 上 


b2=sync_with_stdio(b) 


b=sync_with_stdio() 


一 个 同步 状态 ; 静态 函数 


b=sync_with_stdio(true) 


在 程序 执行 过 程 中 ,， 若 在 第 一 个 iostream 操作 之 前 调用 了 sync_with_stdio(true)， 标 准 库 
保证 iostream 和 标准 输入 输出 〈 见 43.3 节 ) 操作 共享 缓冲 区 。 而 在 第 一 个 流 操作 之 前 调用 
sync_with_stdio(false) 则 会 阻止 共享 缓冲 区 ， 这 在 某 些 实现 中 能 显著 提高 IO 性 能 。 

注意 ，ios_base 既 没 有 拷贝 操作 也 没有 移动 操作 。 


badbit 
failbit 
eofbit 
goodbit 


ios_base 流 状 态 iostate 成 员 常量 (iso.27.5.3.1.3 ) 
发 生 了 出 乎 意料 的 严重 事情 (例如 ， 人 磁盘 读 错误 ) 
发 生 了 出 乎 意料 的 事情 (例如 ， 读 取 数 字 却 得 到 一 个 'x') 
到 达 输 入 尾 (如 文件 尾 ) 
一 切 顺 利 


basic_ios 提供 了 读 取 这 些 流 状 态 位 的 函数 (good() 、fail() 等 ) 。 


trunk 


ios_base 模式 openmode 成 员 常量 (iso.27.5.3.1.4 ) 
追加 (在 流 尾部 插入 输出 ) 
尾部 (定位 到 流 尾部 ) 
不 格式 化 字符 
输入 流 
输出 流 
在 使 用 之 前 截断 流 (将 流 的 大 小 设置 为 0 ) 


ios_base::binary 的 确切 含义 依赖 于 具体 实现 。 但 是 ， 通 常 的 含义 是 将 字符 映射 为 字 节 。 


template<typename T> 
char* as_bytes(T& i) 


{ 
return static_cast<char*>(&i); // 将 内 存 中 的 数据 以 字 节 处 理 
} 
void test() 
{ 
ifstream ifs("source",ios base::binary); l/ 以 二 进 制 方式 打开 流 
ofstream ofs("target",ios_base::binary); 中 以 二 进 制 方式 打开 流 
vector<int> v; 
for (int i; ifs.read(as_bytes(i),sizeof(i));) 儿 从 二 进 制 文件 读 取 字 节 
v.push_back(i); 
外 ... 对 v 进 行 一 些 处 理 .… 
for (auto i : v) /| 向 二 进 制 文件 写 入 字 节 : 
ofs.write(as_bytes(i),sizeof(i)); 
} 


当 你 处 理 的 对 象 “ 仅 是 一 堆 比 特 ” 且 无 明显 合理 的 字符 串 表 示 时 ,使 用 二 进 制 WO。 图 像 和 
声音 / 视频 是 典型 的 例子 。 
操作 seekg() ( 见 38.6.2 节 ) 和 seekp() ( 见 38.6.2 节 ) 要 求 指明 定位 方向 : 


ios_base 方向 seekdir 成 员 常量 (iso.27.5.3.1.5 ) 


beg 从 当前 文件 头 定位 
cur 从 当前 位 置 定位 
end 从 当前 文件 尾 反 向 定位 


从 basic_ios 派生 的 类 根据 保存 在 它们 的 basic_io 中 的 信息 格式 化 输出 及 抽取 对 象 。 
basic_io 操作 可 概括 如 下 : 


basic_ios<C,Tr> (iso.27.5.5 ) 


basic_ios ios {p}; 用 给 定 的 p 指向 的 流 缓冲 区 构造 ios 
ios.“basic_ios() 销毁 ios: 释放 ios 的 所 有 资源 

bool b {ios}; 转换 为 bool 类 型 : b 被 初始 化 为 lios.fail(); 显 式 构 造 函 数 
b=lios b=ios.fail() 

st=ios.rdstate() st 为 ios 的 iostate 

ios.clear(st) 将 ios 的 iostate 设置 为 st 

ios.clear() 将 ios 的 iostate 设置 为 良好 
ios.setstate(st) 将 st 添加 到 ios 的 iostate 

ios.good() ios 的 状态 为 良好 ( 即 goodbit 置 位 ) 吗 ? 
ios.eof() ios 的 状态 为 到 达 文 件 尾 吗 ? 

ios.fail() ios 的 状态 为 失败 或 故障 吗 ? 

ios.bad() ios 的 状态 为 故障 吗 ? 


st=ios.exceptions() st 为 ios 的 iostate 的 异常 位 
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( 续 ) 
basic_ios<C,Tr> (iso.27.5.5 ) 
ios.exceptions(st) 将 ios 的 iostate 的 异常 位 设置 为 st 
p=ios.tie() p 为 指向 连接 的 流 的 指针 或 nullptr 
p=ios.tie(os) 将 输出 流 os 连接 到 ios; p 指向 之 前 连接 的 流 或 为 nullptr 
p=ios.rdbuf() p 为 指向 ios 的 流 缓冲 区 的 指针 
p=ios.rdbuf(p2) 将 ios 的 流 缓冲 区 设置 为 p2 指向 的 缓冲 区 ; p 指向 之 前 的 流 缓冲 区 


ios3=ios.copyfmt(ios2) ” 将 ios2 的 状态 中 与 格式 化 相关 的 部 分 拷贝 到 ios ; 调用 ios2 的 类 型 为 copyfmt_ 
event 的 回调 函数 ; 拷贝 jos2.pword 和 ios2.iword 指向 的 值 ; ios3 为 之 前 的 格式 状态 


c=ios.fill() Cc 为 ios 的 填充 字符 

C2=ios .fill(c) 将 ios 的 填充 字符 设置 为 c; c2 为 之 前 的 填充 字符 

loc2=ios.imbue(loc) 将 ios 的 区 域 设置 为 loc; loc2 为 之 前 的 区 域 设 置 

c2=narrow(c,d) c2 是 一 个 char 值 ， 是 c 转换 为 char_type 的 结果 ; 若 转换 不 成 功 ， 得 到 默认 值 d ; 
use_facet<ctype<char_type>>(getloc()).narrow(c,d) 

c2=widen(c) c2 是 一 个 char_ type 值 ， 是 c 转 换 为 char 类 型 的 结果 ; use_facet<ctype<char_ 
type>>(getloc()).widen(c) 

ios.init(p) 将 ios 设置 为 默认 状态 ， 使 用 p 指向 的 流 缓冲 区 ;保护 函数 

ios.set_rdbuf(p) 令 ios 使 用 p 指向 的 流 缓冲 区 ; 保护 函数 

ios.move(ios2) 拷贝 和 移动 操作 ; 保护 函数 

ios.swap(ios2) 交换 ios 和 ios2 的 状态 ; 保护 函数 ; 不 抛 出 异常 


ios (包括 istream 和 ostream) 可 以 转换 为 bool|， 对 于 连续 读 取 很 多 值 的 问题 ， 人 们 常用 的 
编码 方式 就 需要 这 种 转换 能 力 : 
for (X x; cin>>x;) { 
| 
} 
在 这 段 代 码 中 ，cin>>x 的 返回 值 是 指向 cin 的 ios 的 一 个 引用 。 此 ios 隐 式 转换 为 一 个 
bool， 表 示 cin 的 状态 。 因 此 ， 可 编写 等 价 代 码 如 下 : 
for (X x; !(cin>>x).fail();) { 
a 
} 
tie() 可 用 来 保证 已 连接 流 的 输出 出 现在 它 所 连接 到 的 流 的 输入 之 前 。 例 如 ， 若 将 cout 连接 
到 cin， 我们 可 以 这 样 编写 代码 : 


cout << "Please enter a number: "; 
int num; 
cin >> num; 


这 段 代码 没有 显 式 调用 cout.flush()， 因 此 假如 cout 未 连接 到 cin， 用 户 将 不 会 看 到 输入 
提示 。 


ios_base 操作 (iso.27.5.3.5，iso.27.5.3.6 ) 





i=xalloc() i 为 新 (iword,pword) 对 的 索引 ; 静态 函数 
r=iob.iword(i) r 为 指向 第 i 个 long 的 引用 
r=iob.pword(i) r 为 指向 第 i 个 void* 的 引用 


iob.register_callback(fn,i) 为 iword(i) 注册 回调 函数 fn 
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人 们 有 时 希望 添加 流 的 状态 。 例 如 ，, 某 人 可 能 希望 流 “ 了 解 ” 一 个 complex 应 该 以 极 坐 标 
输出 还 是 笛 卡 尔 坐标 输出 。 类 ios_base 提供 了 一 个 函数 xalloc() 为 这 种 简单 的 状态 信息 分 
配 空间 。xalloc() 的 返回 值 指明 了 一 对 地 址 ， 可 被 iword() 和 pword() 所 访问 。 

有 时 ， 实 现 者 或 用 户 需要 接收 流 状态 变化 的 通知 。 函 数 register_callback()“ 注 册 ” 一 
个 函数 ， 当 “事件 ”发 生 时 注册 的 函数 会 被 调用 。 因 此 ， 调 用 imbue()、copyfmt() 或 "ios_ 
base() 会 分 别 调用 为 imbue_event、copyfmt_event 和 erase_event 事件 “注册 ”的 函数 。 
当 状 态 改变 时 ， 注 册 的 函数 被 调用 ， 执 行 register_callback() 时 提供 的 i 作为 参数 传递 给 回 
调 函 数 。 

类 型 event 和 event_callback 定义 在 ios_base 中 : 


enum event { 
erase_event, 
imbue_event, 
copyfmt_event 


}»; 
using event_caliback = void (*)(event, ios_base&, int index); 
38.4.5 格式 化 


IO 流 格式 化 是 通过 对 象 类 型 、 流 状态 ( 见 38.4.4 节 )、 格 式 化 状态 ( 见 38.4.5.1 节 )、 区 
域 信息 ( 见 第 39 章 ) 及 显 式 操 作 (如 操纵 符 ; 见 38.4.5.2 节 ) 的 组 合 来 控制 的 。 
38.4.5.1 格式 化 状态 

在 <ios> 中 ,标准 库 定 义 了 一 组 格式 化 常量 ， 这 组 常量 是 类 ios_base 的 成 员 ， 类 型 为 
位 掩 码 类 型 fmtflags， 其 具体 定义 依赖 于 C++ 实现 : 


ios_base 格式 化 fmtflags 常量 (iso.27.5.3.1.2 ) 


boolalpha 使 用 true 和 false 的 符号 化 表示 

dec 十 进 制 整数 

hex 十 六 进 制 整数 

oct 八进制 整数 

fixed 浮 点 格式 dddd.dd 

scientific 科学 记 数 法 格式 dddddEdd 

internal 在 前 级 (如 +) 和 数值 之 间 打 补丁 

left 在 数值 之 后 打 补丁 

right 在 数值 之 前 打 补丁 

showbase 输出 八进制 数 加 前 级 0， 十 六 进 制 数 加 前 缀 0x 
showpoint 总 是 显示 小 数 点 (如 123.) 

showpos 对 正 数 显示 + (如 +123) 

skipws 输入 时 忽略 空白 符 

unitbuf 每 次 输出 操作 后 都 刷新 缓冲 区 

uppercase 数值 输出 时 使 用 大 写 ， 如 1.2E10 和 0X1A2 
adjustfield 设置 数值 在 其 区 域 中 的 位 置 : left、right 或 internal 
basefield 设置 整数 的 基数 : dec、oct 或 hex 

floatfield 设置 浮 点 格式 : scientific 或 fixed 


奇怪 的 是 ， 并 不 存在 defaultfloat 和 hexfloat 标志 。 为 了 实现 等 价 功能 ， 我 们 可 以 使 用 操纵 
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符 defaultfloat 和 hexfloat ( 见 38.4.5.2 节 ), 或 直接 操纵 ios_base: 


ios.unsetf(ios_base::floatfield); 1// 使 用 默认 浮 点 数 格式 
ios.setf(ios_base::fixed | ios_base::scientific, ios_base'::floatfield); 儿 使 用 十 六 进 制 浮 点 数 


ios_base 提供 了 读 写 iostream 格式 状态 的 操作 : 


ios_base 格式 化 fmtflags 操作 (iso.27.5.3.2 ) 





f=ios.flags() f 为 ios 的 格式 标志 

f2=ios.flags(f) 将 ios 的 格式 标志 设置 为 f; 人 2 为 旧 标 志 
f2=ios.setf(f) 将 ios 的 格式 标志 设置 为 f; f2 为 旧 标志 值 
f2=ios.setf(f,m) f2=ios.setf(f&m) 

ios.unsetf(f) 清除 ios 的 标志 ff 

n=ios.precision() n 为 ios 的 精度 

n2=ios.precision(n) 将 ios 的 精度 设置 为 n; n2 为 旧 精 度 
n=ios.width() n 为 ios 的 宽度 

n2=ios.width(n) 将 ios 的 宽度 设置 为 n; n2 为 旧 宽 度 


精度 是 一 个 整数 值 ， 它 决定 了 浮 点 数 显 示 多 少 位 数字 : 
e 一 汪 (general) 格式 (defaultfloat) 表示 让 C++ 实现 自己 选择 呈现 浮 点 值 的 格式 ， 以 
达到 在 可 用 空间 内 最 好 地 表示 浮 点 值 的 效果 。 精 度 指出 最 多 使 用 多 少 位 数字 。 
@ 科学 记 数 法 ( scientific) 格式 ( scientific) 呈现 浮 点 值 的 方式 是 在 小 数 点 之 前 保留 一 
位 数字 ， 结 合 指数 表示 。 精 度 指 出 在 小 数 点 后 最 多 保留 多 少 位 数字 。 
。 定点 (fixed) 格式 (fixed) 将 浮 点 值 表 示 为 整数 部 分 接 小 数 点 再 接 小 数 部 分 。 精 度 指 
出 在 小 数 点 后 最 多 保留 多 少 位 数字 。 示 例 请 见 38.4.5.2 节 。 
C++ 对 浮 点 值 采用 四 舍 五 和 人 而 不 是 截断 的 处 理 方式 。precision() 不 影响 整数 的 输出 。 例 如 : 
cout.precision(8); 


cout << 1234.56789 <<'' <« 1234.56789 <<'' << 123456 << "\n'; 


cout.precision(4); 
cout << 1234.56789 <<'' <« 1234.56789 <<'' << 123456 << \n'; 


这 上段 代 人 码 输 出 


1234.5679 1234.5679 123456 
1235 1235 123456 


函数 width() 指出 下 一 个 标准 库 << 操 作 输 出 数值 、bool、C 风格 字符 串 、 字 符 、 指 针 、 
string 和 bitset ( 见 34.2.2 节 ) 最 少 占用 多 少 个 字符 位 置 。 例 如 : 


cout.width(4); 
cout << 12; // 打印 12， 后 接 两 个 空格 


我 们 可 以 用 函数 人 ll() 指定 “补丁 ”或 “填充 ”字符 。 例 如 : 


cout.width(4); 
cout.fill('#"); 
cout << "ab"; 中 打印 ##ab 


默认 填充 字符 是 空格 符 ， 而 默认 域 宽 0， 表 示 “ 按 需 分 配 宽度 ”。 我 们 可 以 像 下 面 这 样 恢复 


cout.width(0); W" 按 需 分 配 宽度 " 
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调用 width(n) 会 将 最 小 宽度 设置 为 n。 如 果 输 出 内 容 需 要 占用 更 多 字符 位 置 ， 则 所 有 内 容 都 
会 打印 出 来 。 例 如 : 
cout.width(4); 
cout <<“abcdef"; // 打 印 abcdef 
这 段 代码 不 会 将 输出 截断 为 abcd。 正 确 但 不 好 看 的 输出 通常 比 错误 但 好 看 的 输出 有 意义 得 多 。 
调用 width(n) 只 影响 下 一 个 << 输出 操作 。 例 如 : 
cout.width(4); 
cout.fill('#'); 
cout << 12 << "<< 13; 儿 打 印 挫 12:13 
这 段 代 码 会 输出 奉 12:13 而 不 是 # 检 12##:##13。 
如 果 通 过 很 多 分 离 的 操作 显 式 控制 格式 化 选项 令 人 厌烦 ， 那么 可 以 利用 用 户 自 定义 操作 
符 ( 见 38.4.5.3 节 ) 组 合 它们 。 
ios_base 也 人 允许 程序 员 设 置 iostream 的 locale ( 见 第 39 章 ): 


ios_base locale 操作 (iso.27.5.3.3 ) 
loc2=ios.imbue(loc) 将 ios 的 区 域 设置 为 loc; loc2 为 旧 区 域 设 置 
loc=ios.getloc() loc 为 ios 的 区 域 设置 








38.4.5.2 ”标准 操纵 符 
标准 库 提 供 了 对 应 不 同 格式 状态 和 状态 改变 的 操纵 符 。 标 准 操纵 符 定 义 在 <ios>、 
<istream> 、<ostream> 和 <iomanip> (接受 参数 的 操纵 符 ) 中 。 


<ios> 中 的 I/O 操纵 符 (iso.27.5.6，iso.27.7.4 ) 


s<<boolalpha 使 用 true 和 false 的 符号 化 表示 (输入 和 输出 ) 
s<<noboolalpha s.unsetf(ios_base::boolalpha) 

s<<showbase 输出 八进制 数 加 前 缀 0， 十 六 进 制 数 加 前 缀 0x 
S<<noshowbase s.unsetf(ios_base::showbase) 
s<<showpoint 总 是 显示 小 数 点 

s<<noshowpoint s.unsetf(ios_base::showpoint) 

s<<showpos 对 正 数 显示 + 

S<<noshowpos s.unsetf(ios_base::showpos) 

s<<uppercase 输出 数值 时 使 用 大 写 ， 如 1.2E10 和 0X1A2 
s<<nouppercase 输出 数值 时 使 用 小 写 ， 如 1.2e10 和 0x1a2 
s<<unitbuf 每 次 输出 操作 后 都 刷新 缓冲 区 

s<<nounitbuf 不 是 每 次 输出 操作 后 都 刷新 缓冲 区 
s<<internal 在 值 内 部 特定 位 置 打 补丁 

s<<left 在 值 之 后 打 补 丁 

s<<right 在 值 之 前 打 补 丁 

s<<dec 整数 的 基数 为 10 

s<<hex 整数 的 基数 为 16 

s<<oct 整数 的 基数 为 8 

s<<fixed 浮 点 数 格式 为 dddd.dd 

s<<scientific 科学 记 数 法 格式 d.ddddEdd 


s<<hexfloat 小 数 部 分 和 指数 部 分 使 用 十 六 进 制 ， 指 数 部 分 以 p 开始 ， 如 A.1BEp-C 和 a.bcdef 
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( 续 ) 
<ios> 中 的 I/O 操纵 符 (iso.27.5.6，iso.27.7.4 ) 
s<<defaultfloat 使 用 默认 浮 点 数 格式 
s>>skipws 忽略 空白 符 
S>>noskipws s.unsetf(ios_base::skipws) 


这 些 操作 都 返回 指向 第 一 个 ( 流 ) 运算 对 象 s 的 引用 。 例 如 : 
cout << 1234 << ', << hex << 1234 << ', << oct << 1234 << \n'; 几 打 印 1234,4d2,2322 


我 们 可 以 显 式 设置 浮 点 数 的 输出 格式 : 


constexpr double d = 123.456; 


cout <<d<<";" 
<< scientific << d <<";" 
<< hexfloat << d <<";" 
<<fixed <<d <<";" 
<< defaultfloat << d << \n'; 


这 段 代码 输出 : 
123.456; 1.234560e+002; 0x1.edd2f2p+6; 123.456000; 123.456 


浮 点 数 格 式 是 “有 黏 性 的 "; 即 ， 对 后 续 浮 点 操作 一 直 保 持 有 效 。 


<ostream>l/O 操纵 符 (iso.27.5.6，iso.27.7.4 ) 


os<<endl| 
os<<ends 


os<<flush 


输出 \n' 并 刷新 缓冲 区 
输出 \0' 
刷新 缓冲 区 


在 以 下 场景 ostream 会 被 刷新 : 流 被 销毁 、 连 接 的 istream 需要 输入 ( 见 38.4.4 节 )、C++ 
实现 发 现 刷 新 流 会 有 性 能 收益 。 我 们 很 少 需要 显 式 刷新 流 。 类 似 地 ，<<endl 可 以 认为 与 
<<'\n' 等 价 ， 但 后 者 可 能 快 一 点 儿 。 而 且 ， 我 认为 

cout << "Hello, World!l\n"; 
比 下 面 的 等 价 形式 更 易 读 易 写 : 

cout << "Hello, World!"” << endl; 


如 果 你 确实 需要 频繁 刷新 缓冲 区 ， 可 考虑 使 用 cerr 和 unitbuf。 


s<<resetiosflags(f) 
s<<setiosflags(f) 
s<<setbase(b) 
s<<setfill(int c) 
s<<setprecision(n) 
s<<setw(n) 


is>>get_money(m,intl) 


is>>get_money(m) 


<iomanip> 中 的 I/O 操纵 符 (iso.27.5.6，iso.27.7.4 ) 

清除 标志 f 

设置 标志 ff 

按 b 进 制 输出 整数 

将 填充 字符 设置 为 c 

设置 精度 为 n 位 数字 

设置 下 一 个 域 宽 为 n 个 字符 

按 is 的 money_get 设 置 从 is 读 取 数 据 ; m 是 一 个 long double 或 一 个 basic_ 
string; 若 intl==true， 使 用 标准 的 三 字符 货币 名 


s>>get_money(m,false) 
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( 续 ) 
<iomanip> 中 的 I/O 操纵 符 (iso.27.5.6，iso.27.7.4 ) 
os<<put_money(m,intl) 按 os 的 money_get 设置 将 m 写 至 os ; 此 money_get 确 定 了 对 m 来 说 什么 样 
的 类 型 是 可 接受 的 ; 若 intl==true， 使 用 标准 的 三 字符 货币 名 
os<<put_money(m) s<<put_money(m,false) 
is>>get_time(tmp,fmt) 按 格式 fmt 读 取 时 间 存 人 *tm， 使 用 is 的 time_get 设置 
os<<put time(tmp,fmt) 按 格式 fmt 将 *tmp 输出 到 os， 使 用 os 的 time_put 设置 


区 域 设 置 中 的 时 间 模 块 将 在 39.4.4 节 中 介绍 ， 时 间 格 式 将 在 43.6 节 中 介绍 。 
下 面 是 带 参 操纵 符 的 简单 使 用 示例 : 


cout << '(' << setw(4) << setfil(#") << 12 << ") (" << 12 << ")\n"; /1 打印 ( 捧 12) (12) 


istream 操纵 符 (iso.27.5.6，iso.27.7.4 ) 





s>>skipws 忽略 空白 符 (在 <ios> 中 ) 
s>>noskipws s.unsetf(ios_base::skipws) (在 <ios> 中 ) 
is>>ws 吃 掉 空白 符 (在 <istream> 中 ) 


默认 情况 下 >> 会 忽略 空白 符 ( 见 38.4.1 节 )。 此 默认 设置 可 通过 >>skipws 和 >>noskipws 


string input {"0 1 2 3 4")}; 
istringstream iss {input}; 
string s; 
for (char ch; iss>>ch;) 
s+= ch; 
cout << Si 省 打印 "01234" 


istringstream iss2 {input}; 
iss>>noskipws; 
for (char ch; iss2>>ch;) 

s+= Ch; 
cout << Si; 1 放 打 印 "01234" 
} 


如 果 你 希望 显 式 处 理 空白 符 (例如 ， 逐 行 处 理 数据 ) 且 还 想 使 用 >>，noskipws 和 >>ws 会 
很 方便 。 
38.4.5.3 ”用 户 自 定义 操纵 符 

程序 员 可 以 自 定义 与 标准 操纵 符 风格 一 致 的 新 操纵 符 。 本 市 将 介绍 一 种 新 的 风格 ,我 认 
为 它 对 浮 点 数 格式 化 非常 有 用 。 

格式 化 是 由 一 大 批 独 立 的 函数 控制 的 ( 见 38.4.5.1 节 )， 常 常 令 人 困惑 。 例 如 ，precision() 
对 后 续 输出 操作 一 直 保 持 有 效 ，width() 则 只 对 下 一 个 数值 输出 操作 有 效 。 我 所 需要 的 是 一 种 
简单 的 机 制 ， 可 以 按 预 定义 的 模式 输出 一 个 浮 点 数 ， 而 不 影响 流 上 未 来 的 得 出 操作 。 基 本 思想 
是 定义 一 个 类 表示 格式 ， 定 义 另 一 个 类 表示 特定 格式 和 待 格式 化 的 值 ， 然 后 定义 一 个 运算 符 
<< 根据 格式 将 值 输出 到 一 个 ostream。 例 如 : 

Form gen4 {4}; 儿 一般 格 式 ， 精 度 4 


void f(double d) 


} 
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Form sci8; 
sci8.scientific().precision(8); 儿科 学 记 数 法 格式 ， 精 度 8 
cout <<d <<''<< gen4(d) << “<< sci8(d) << “<< d << "\n'; 


Form sci {10,ios_base::scientific}; // 科 学 记 数 法 格式 ， 精 度 10 
cout <<d <<''<< gen4(d) << ”<< sci(d) <<'' <<d <<"\n’; 


调用 f(1234.56789) 会 输出 : 


1234.57 1235 1.23456789e+003 1234.57 
1234.57 1235 1.2345678900e+003 1234.57 


意 如 何 使 用 Form 而 不 影响 流 的 状态 ， 从 而 最 后 一 个 输出 d 的 操作 与 第 一 


Re 
下 面 是 一 个 简化 的 实现 : 
class Form; /我 们 的 格式 化 类 型 


struct Bound_ form { /格式 与 值 


}; 


const Form& f; 
double val; 


class Form { 


friend ostream& operator<<(ostream&, const Bound_form&); 


int prc; 

int wdt; 宽度 0 表示 ““' 按 需 分 配 宽度 ” 

int fmt; Re 科学 记 数 法 或 定点 ( 见 38.4.5.1 节 ) 
fh 


public: 
explicit Form(int p =6, ios_base::fmtflags f =0, int w =0) : prc{p}, fmt{f}, wdt{w} {} 


}; 


一 个 输出 操作 一 样 


Bound_ form Form::operator()(double d) const /为 *this 和 d 创建 一 个 Bound form 


{ 


return Bound_form{:this,d}; 


} 


Form& scientific() { fmt = ios_base::scientific; return *this; } 
Form& fixed() { fmt = ios_base::fixed; return *this; } 
Form& general() { fmt = 0; return *this; } 


Form& uppercase(); 
Form& lowercase(); 
Form& precision(int p) { prc = pi return *this; } 


Form& width(int w) { wdt = w; return *this; } 咱 应 用 到 所 有 类 型 
Forma& fill(char); 


Form& plus(bool b = true); 川 显 式 加 号 
Forma& trailing_zeros(bool b = true); 儿 打印 尾 置 0 
Wa 


Form 的 设计 思想 是 保存 格式 化 一 个 数据 项 所 需 的 信息 。 它 选择 了 一 些 适合 大 多 数 用 途 的 默 


认 设 置 ， 并 提供 了 多 个 成 员 函 数 来 重 置 格式 化 的 不 同方 面 。i 


运算 符 () 用 于 将 值 与 其 输出 格 
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式 绑 定 在 一 起 。 这 样 ， 一 个 Bound_form ( 即 ， 一 个 Form 加 上 一 个 值 ) 就 可 以 用 合适 的 << 
函数 输出 到 一 te 


ostream& operator<<(ostream& os, const Bound_ _ form& bf) 


{ 
ostringstream s; 儿 见 38.2.2 节 
s.precision(bf.f.prc); 
s.setf(bf.f.fmt,ios base::floatfield); 
s << bf.val; 儿 生 成 字符 串 保 存在 s 中 
return os << s.str(); 咱 将 s 输 出 到 os 

} 


编写 更 复杂 的 << 实现 留 作 练 习 . 
注意 ， 这 些 声明 令 << 和 () 的 组 合 变 成 一 个 三 元 运算 符 : cout<<sci4{d} 将 ostream、 
格式 和 值 汇集 到 单一 函数 中 ， 然 后 再 进行 真正 的 计算 。 


38.5 流 迭 代 器 


在 <iterator> 中 ， 标 准 库 提 供 了 流 迁 代 器 ， 能 将 输入 和 输出 流 作为 序列 [输入 起 始 : 输 
入 尾 ) 和 [输出 起 始 : 输出 尾 ) 来 处 理 : 


template<typename T， 
typename C = char, 
typename Tr = char traits<C>, 
typename Distance = ptrdiff_t> 
class istream_iterator 
:public iterator<input_iterator_tag, T, Distance, const T+, const T&> { 
Using char type = C; 
using traits_type = Tr; 
using istream type = basic istream<C,Tr>; 
bh 
上 


template<typename T, typename C = char, typename Tr = char traits<C>> 
class ostream_iterator: public iterator<output_iterator_tag, void, void, void, void> { 
using char type = Ci 
using traits_type = Tr; 
using ostream type = basic_ostream<C,Tr>; 
ts 
$B 


例如 : 


copylistream_iterator<double>{cin}, istream_iterator<double,char>{}, 
ostream _ iterator<double>{cout,";\n"}); 


当 用 两 个 实 参 (第 二 个 是 string) 构造 一 个 ostream_iterator 时 ， 该 字符 串 参 数 会 在 每 个 
元 素 值 之 后 输出 该 字符 串 作 为 结束 符 。 因 此 ， 如 果 对 此 copy() 调用 你 键入 了 1 2 3， 则 输 
出 为 : 


3; 


stream_iterator 提供 与 其 他 迭代 器 适配器 一 样 的 操作 ( 见 33.2.2 市 ): 
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流 和 迭代 器 操作 (iso.24.6 ) 


istream_iterator p {st}; 为 输入 流 st 创建 迭代 器 

istream_iterator p {p2}; 拷贝 构造 函数 : p 为 istream_iterator p2 的 副本 

ostream_iterator p {st}; 为 输出 流 st 创建 迭代 器 

ostream_iterator p {p2}; 拷贝 构造 函数 : p 为 ostream_iterator p2 的 副本 

ostream_iterator p {st,s}; 为 输出 流 st 创建 迭代 器 ; 使 用 C 风格 字符 串 s 作为 输出 元 素 间 的 分 隔 
p=p2 p 为 p2 的 副本 

p2=++p p 和 p2 指向 下 一 个 元 素 

p2=p++ p2=p,++p 

*p=X 在 p 之 前 插入 x 

*p++=X 在 p 之 前 插入 x， 然 后 递增 p 


除 构造 函数 之 外 ， 这 些 操作 通常 被 copy() 这 样 的 通用 算法 所 使 用 ， 而 不 是 直接 使 用 。 


38.6 缓冲 


从 概念 上 看 ， 输 出 流 将 字符 放 入 一 个 缓冲 区 。 随 后 某 刻 ， 字 符 被 写 人 (“ 刷 到 ”) 其 目的 
地 。 这 种 缓冲 区 被 称 为 streambuf， 它 定义 在 <streambuf> 中 。 不 同类 型 的 streambuf 实现 
不 同类 型 的 缓冲 策略 。 通 常 ，streambuf 将 字符 保存 在 一 个 数组 中 ， 直 至 发 生 溢出 ， 才 被 迫 
将 字符 写 到 其 真正 的 目的 地 。 因 此 ， 我 们 可 图 示 ostream 如 下 : 






ostream: 


真正 的 目的 地 








locale: 












| 字符 缓冲 区 Ei 





ostream 的 模板 实 参 集 必须 与 其 streambuf 的 模板 实 参 集 相 同 ， 这 些 参数 决定 了 字符 缓冲 区 
中 的 字符 的 类 型 。 

istream 的 图 示 与 之 类 似 ， 只 是 字符 流向 另 一 个 方向 。 

在 无 缓冲 IO 这 种 简单 TO 中 ，streambuf 直接 传输 每 个 字符 ， 而 不 是 保留 它们 直至 能 
高 效 传输 为 止 。 

缓冲 机 制 的 关键 类 是 basic_streambuf: 


template<typename C, typename Tr = char _ traits<C>> 
class basic_streambuf { 


public: 
using char type = Ci; /| 字符 类 型 
using int_type = typename Tr::int_type; 1 字符 可 以 转换 的 整数 类 型 
using pos_type = typename Tr::pos _ type; /缓冲 位 置 类 型 
using off_type = typename Tr::off_type; 儿 缓冲 偏 移 类 型 


using traits_type = Tr; 
Hs 
virtual “basic_streambuf(); 


}; 
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照例 ， 标 准 库 提供 了 一 组 (一 般 认 为 ) 最 常用 的 别名 : 


using streambuf = basic streambuf<char>; 
using wstreambuf = basic_streambuf<wchar_t>; 


basic_streambuf 提供 了 很 多 操作 。 很 多 public 操作 只 是 简单 地 调用 一 个 protected 虚 也 
数 ， 确 保 来自 派 生 类 的 函数 对 特定 种 类 的 缓冲 恰当 地 实现 此 操作 : 


public basic_streambuf<C,Tr> 操作 (iso.27.6.3 ) 








sb.“basic_streambuf() 析 构 琐 数 : 释放 所 有 资源 ; 虚 函 数 
loc=sb.getloc() loc 为 sb 的 区 域 设 置 

loc2=sb.pubimbue(loc) sb.imbue(loc); loc2 为 指 问 之 前 区 域 设 置 的 指针 
psb=sb.pubsetbuf(s,n) psb=sb.setbuf(s,n) 

pos=sb.pubseekoff(n,w,m) pos=sb.seekoff(n,w,m) 
pos=sb.pubseekoff(n,w) pos=sb.seekoff(n,w) 

pos=sb.pubseekpos(n,m) pos=sb.seekpos(n,m) 

pos=sb.pubseekpos(n) pos=sb.seekpos(n,ios_base::in|lios_base::out) 
sb.pubsync() sb.sync() 


由 于 basic_streambuf 设计 为 一 个 基 类 ， 所 以 所 有 构造 函数 都 是 protected 的 。 


protected basic_streambuf<C,Tr> 操作 (iso.27.6.3 ) 








basic_streambuf sb {}; 析 构 sb ， 无 字符 缓冲 区 ， 采 用 全 球 区 域 设 置 

basic_streambuf sb {sb2}; 。 sb 为 sb2 的 副本 (共享 字符 缓冲 区 ) 

sb=sb2 sb 为 sb2 的 副本 (共享 宁 符 缓冲 区 ); sb 的 旧 资 源 被 释放 

sb.swap(sb2) 交换 sb 和 sb2 的 状态 

sb.imbuel(loc) loc 成 为 sb 的 区 域 设置 ; 虚 函 数 

psb=sb.setbuf(s,n) 设置 sb 的 缓冲 区 ; psb=&sb; s 是 一 个 const char, n 是 一 个 streamsize; 虚 函 数 

pos=sb.seekoff(n,w,m) 定位 ， 偏 移 为 n， 方 向 为 w， 模式 为 m ; pos 为 结果 位 置 ， 或 为 pos_type(off 
type(-1)) 表示 错误 ; 虚 函 数 

pos=sb.seekoff(n,w) pos=sb.seekoff(n,w,ios_base::inlios_base::out) 

pos=sb.seekpos(n,m) 定位 到 位 置 n, 模式 m ; pos 为 结果 位 置 , 或 为 pos_type(off_type(-1)) 表示 错 
误 ; 虚 函 数 

n=sb.sync() 将 字符 缓冲 区 与 真正 的 目的 或 源 进行 同步 ; 虚 消 数 


虚 函 数 的 确切 含义 由 派生 类 决定 . 

每 个 streambuf 都 有 一 个 存放 区 (put area)，<< 和 其 他 输出 操作 会 写 人 到 这 里 ( 见 
38.4.2 节 )， 以 及 一 个 读 取 区 (get area)，>> 和 其 他 输入 操作 从 此 读 取 数据 ( 见 38.4.1 节 )。 
两 个 区 域 都 由 一 个 头 指 针 、 当 前 位 置 指针 和 一 个 尾 后 指针 描述 。 
pbase() | | pptr(0 | epptr() 

| I 
本 


eback()] gptr() egptr() 















































缓冲 区 溢出 由 虚 函 数 overflow() 、underflow() 和 uflow() 处 理 ， 
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定位 操作 的 使 用 请 见 38.6.1 节 。 
存 取 接 口 分 为 public 和 protected 两 部 分 : 


public 存 取 basic_streambuf<C,Tr> 操作 (iso.27.6.3 ) 





n=sb.in_avail() 若 读 取 位 置 合 法 ，n=sb.egptr()-sb.gptr(); 否则 返回 sb.showmanyc() 
c=sb.snextc() 递增 sb 的 读 取 指针 ， 然 后 c=*sb.gptr() 

n=sb.sbumpc() 递增 sb 的 读 取 指针 

c=sb.sgetc() 如 果 无 字符 可 供 读 取 ，c=sb.underflow(); 否则 c=*sb.gptr() 
n2=sb.sgetn(p,n) n2=sb.xsgetn(p,n); p 是 一 个 char* 


n=sb.sputbackc(c) 将 c 放 回 读 取 区 并 递减 gptr ; 若 放 回 成 功 ，n=Tr:to_int_ type(*sb.gptr()) ; 否则 n=sb. 
pbackfail(Tr::to_int_type(c)) 





n=sb.sungetc() 递减 读 取 指针 ; 若 成 功 ，n=Tr::to_int_type(*sb.gptr()); 否则 n=sb.pbackfail(Tr::to_int_type(c)) 
n=sb.sputc(c) 如 果 不 能 再 存 入 字符 ，n=sb.overflow(Tr::to_int_type(c)); 否则 *sb.sptr()=c; n=Tr::to_int_type(c) 
n2=sb.sputn(s,n) n2=sb.xsputn(s,n); s 是 一 个 const char* 


protected 接口 提供 操纵 存 取 指针 的 简单 、 高 效 且 通常 是 内 联 的 函数 。 此 外 ， 它 们 都 是 虚 函 
数 ， 可 被 派生 类 和 窗 盖 。 


protected 存 取 basic_streambuf<C,Tr> 操作 )( 续 )(iso.27.6.3 ) 





sb.setg(b,n,end) 读 取 区 为 [b:e); 当前 读 取 指针 为 n 
pc=sb.eback() [pc:sb.egptr()) 为 读 取 区 
pc=sb.gptr() pc 为 读 取 指 针 

pc=sb.egptr() [sb.eback():pc) 为 读 取 区 
sb.gbump(n) 递增 sb 的 读 取 指针 


n=sb.showmanyc() “显示 有 多 少 字 符 ”; n 为 不 调用 sb.underflow() 的 前 提 下 可 以 读 取 多 少 字 符 的 估计 值 ， 
或 者 n=-1 表示 无 字符 准备 好 被 读 取 ; 虚 函 数 

n=sb.underflow() 读 取 区 中 无 更 多 字符 ; 重 填 读 取 区 ; n=Tr:to_int_type(c)， 其 中 c 为 新 的 当前 字符 ; 虚 函 数 

n=sb.uflow() 类 似 sb.underflow()， 但 在 读 取 新 的 当前 字符 后 递增 读 取 指 针 ; 虚 函 数 

n=sb.pbackfail(c) 放 回 操作 失败 ; 若 一 个 覆盖 的 pbackfail() 不 能 放 回 字符 则 n=Tr::eof(); 虚 函 数 

n=sb.pbackfail() n=sb.pbackfail(Tr::eof()) 


sb.setp(b,e) 存放 区 为 [b:e); 当前 存放 指针 为 b 
pc=sb.pbase() [pc:sb.epptr()) 为 存放 区 
pc=sb.pptr() pc 为 存放 指针 

pc=sb.epptr() [sb.pbase():pc) 为 存放 区 
sb.pbump(n) 递增 存放 指针 


n2=sb.xsgetn(s,n) s 是 一 个 const char*; 对 [s:s+n) 中 每 个 p 执行 sb.sgetc(*p); n2 为 读 取 的 字符 数 ， 虚 函数 
n2=sb.xsputn(s,n) s 是 一 个 const char*; 对 [s:s+n) 中 每 个 p 执行 sb.sputc(*p); n2 为 写 人 的 字符 数 ; 虚 项 数 
n=sb.overflow(c) 重 填 存 放 区 ， 然 后 n=sb.sputc(c); 虚 函 数 

n=sb.overflow() n=sb.overflow(Tr::eof()) 


函数 showmanyc() (“显示 有 多 少 字 符 ”) 有 些 奇怪 ， 它 允许 用 户 了 解 机 器 输入 系统 当前 状 
态 的 一 些 信息 。 它 返回 对 “近期 ”可 读 取 多 少 字符 的 一 个 估计 ， 比 如 说 ， 清 空 操作 系统 缓冲 
区 而 非 读 取 磁 盘 的 话 ， 可 以 读 取 多 少 字符 。 在 调用 showmanyc() 时 ， 如 果 它 不 能 承诺 可 读 
到 哪怕 一 个 字符 (在 未 到 达 文 件 尾 的 情况 下 )， 就 会 返回 -1。 这 (肯定) 是 一 个 相当 底层 且 高 








度 依赖 于 具体 C++ 实现 的 操作 。 如 果 没 有 仔细 阅读 系统 文档 并 进行 一 些 实验 ， 请 不 要 草率 
使 用 showmanyc()。 


38.6.1 输出 流 和 缓冲 区 


ostream 提供 了 一 些 操作 ， 可 按照 常规 格式 ( 见 38.4.2 节 ) 和 显 式 格式 化 指令 ( 见 
38.4.5 节 ) 将 各 种 类 型 的 值 转换 为 字符 序列 。 此 外 ，ostream 还 提供 了 直接 处 理 streambuf 
的 操作 : 

template<typename C, typename Tr = char traits<C>> 

class basic_ostream : virtual public basic_ios<C,Tr> { 

public: 


dis 
explicit basic_ostream(basic_streambuf<C,Tr>* b); 


pos_type tellp(); /获取 当前 位 置 
basic_ostream& seekp(pos_type); /设置 当前 位 置 
basic_ostream& seekpl(off type, ios_base::seekdir); /设置 当前 位 置 


basic_ostream& flush(); /清空 缓冲 区 ( 写 到 真正 目的 ) 
basic_ostream& operator<<(basic_streambuf<C,Tr>* b); 儿 输出 来 自 b 的 数据 
}; 
basic_ostream 函数 覆盖 了 其 basic_ios 基 类 中 对 应 的 函数 。 
ostream 的 构造 函数 接受 一 个 streambuf 参数 ， 它 决定 了 输出 的 字符 如 何 处 理 以 及 最 终 
输出 到 哪里 。 例 如 ， ostringstream ( 见 38.2.2 节 ) 或 ofstream ( 见 38.2.1 节 ) 的 创建 都 是 用 
一 处 适合 A 的 a ( 见 38.6 节 ) 来 初始 化 一 个 ostream。 
seekp() 函数 用 来 在 ostream 中 定位 输出 位 置 。 后 级 p 表示 这 是 将 字符 放 入 (putting) 
流 的 位 置 。 只 有 流 关联 到 定位 操作 有 意义 的 目的 ， 如 文件 ， 这 些 函 数 才 有 效果 。pos_type 
表示 文件 中 的 位 置 ，off_type 表示 偏 移 ，ios_base::seekdir 指出 方向 。 
流 位 置 从 0 开始 ， 因 此 我 们 可 以 将 一 个 文件 看 作 一 个 包含 n 个 字符 的 数组 。 例 如 : 


int f(ofstream& fout)// fout 关联 某 个 文件 


{ 
fout << "0123456789"; 
fout.seekp(8); // 距 文件 头 8 个 字符 的 位 置 
fout << #'; /添加 品 并 移动 位 置 (+1 ) 
fout.seekp(-4,ios_base::cur); 儿 从 当前 位 置 向 后 4 个 字符 
fout << '*"; 咱 添 加 并 移动 位 置 (+1 ) 

} 

如 果 文 件 初始 为 空 ， 则 最 后 得 到 : 
01234:67#9 


没有 类 似 的 方法 可 以 进行 普通 istream 或 ostream 上 的 随机 元 素 访 问 。 试 图 定位 到 文件 头 之 
前 或 文件 尾 之 后 通常 会 令 流 进入 bad() 状态 ( 见 38.4.4 节 )。 但 是 ， 某 些 操作 系统 的 操作 模 
式 可 能 有 不 同 的 行为 (例如 ， 定 位 操作 能 改变 文件 大 小 )。 

flush() 操作 人 允许 用 户 不 必 等 到 溢出 就 能 清空 缓冲 区 。 

我 们 可 以 用 << 将 一 个 streambuf 直接 写 人 一 个 ostream 中 。 这 主要 方便 了 IO 机 制 的 
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38.6.2 ”输入 流 和 缓冲 区 


istream 提供 了 一 些 操作 ， 可 将 读 入 的 字符 转换 为 各 种 类 型 的 值 ( 见 38.4.1 节 )。 此 外 ， 
istream 还 提供 了 直接 处 理 streambuf 的 操作 : 


template<typename C, typename Tr = char traits<C>> 

class basic_istream : virtual public basic_ios<C,Tr> { 

public: 
lss 
explicit basic_istream(basic_streambuf<C,Tr>* b); 
pos_type tellg(); 中 获取 当前 位 置 
basic_istream& seekg(pos type); 咱 设 置 当前 位 置 
basic_istream& seekg(off type, ios base::seekdir); 咱 设 置 当前 位 置 





basic_istream& putback(C c); J 将 c 放 回 缓冲 区 

basic_istream& unget(); 咱 放 回 最 近 读 取 的 字符 

int_type peek(); 中 查看 下 一 个 将 要 读 取 的 字符 

int sync(); /| 清除 缓冲 区 (刷新 ) 

basic_istream& operator>>(basic_streambuf<C,Tr>* b); 外 读 取 数据 存 入 b 


basic_istream& get(basic_streambuf<C,Tr>& b, C t = Tr::newline()); 
streamsize readsome(C* p, streamsize n); 。 // 读 取 最 多 n 个 字符 


}; 
basic_istream 的 函数 覆盖 了 其 basic_ios 基 类 中 对 应 的 函数 。 

定位 函数 工作 方式 类 似 ostream 的 对 应 函数 ( 见 38.6.1 节 )。 后 级 g 表示 这 是 从 流 中 
读 取 (getting) 字符 的 位 置 。 后 级 p 和 g 是 必要 的 ， 因 为 我 们 可 以 创建 一 个 从 istream 和 
ostream 派生 的 iostream， 这 样 一 个 流 需要 同时 追踪 读 取 位 置 和 存放 位 置 

函数 putback() 允许 程序 将 一 个 字符 “ 放 回 "istream 中 ， 从 而 成 为 下 一 个 被 读 取 的 字符 。 
函数 unget() 放 回 最 近 读 取 的 字符 。 但 不 幸 的 是 ， 回 退 输入 流 并 不 总 是 可 行 的 。 例 如 ， 试 图 
退回 到 读 取 的 第 一 个 字符 之 前 的 位 置 会 设置 ios_base::failbit 标志 。 标 准 库 可 以 保证 的 是 你 
能 退回 刚刚 成 功 读 取 的 那个 字符 。 函 数 peek() 读 取 下 一 个 字符 ,但 将 它 留 在 streambuf 中 ， 
这 样 该 字符 就 可 以 再 次 被 读 取 。 因 此 ，c=peek() 逻辑 上 等 价 于 (c=get(),unget(),c)。 设置 
failbit 标志 可 能 会 触发 一 个 异常 ( 见 38.3 节 )。 

我 们 可 以 用 sync() 刷新 istream， 但 不 能 保证 总 是 成 功 。 为 刷新 某 些 类 型 的 流 ， 我 们 
需要 从 真正 的 源 重读 数据 ， 而 这 有 可 能 不 可 行 或 不 可 取 (例如 ， 对 一 个 关联 到 网 络 的 流 这 
样 做 )。 因 此 ， 如 果 刷 新 成 功 ，sync() 会 返回 0。 若 失败 ， 它 会 设置 ios_base::failbit 标志 
( 见 38.4.4 节 ) 并 返回 -1。 设 置 badbit 可 能 会 触发 一 个 异常 ( 见 38.3 节 )。 对 一 个 关联 到 
ostream 的 缓冲 区 执行 sync() 会 将 缓冲 区 内 容 刷 新 到 输出 。 

直接 从 streambuf 读 取 数据 的 >> 和 get() 操作 主要 供 IO 特性 的 实现 者 所 用 。 

函数 readsome() 是 一 个 底层 操作 ， 它 人 允许 用 户 窥探 一 个 流 是 否 有 字符 可 供 读 取 。 当 我 们 不 
想 等 待 输入 时 (比如 说 ， 等 待 来 自 键盘 的 输入 )， 这 个 操作 非常 有 用 。 参 见 in_avail() ( 38.6 节 )。 


38.6.3 缓冲 区 和 迭代 器 


在 <iterator> 中 ， 标 准 库 提 供 了 istreambuf iterator 和 ostreambuf iterator， 它 们 人 允 
许 用 户 (大 多 数 是 新 iostream 的 实现 者 ) 遍历 流 缓 冲 区 中 的 内 容 。 特 别 是 ， 这 两 种 迭代 器 被 
locale facet 广泛 使 用 ( 见 第 39 章 )。 
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38.6.3.1 istreambuf iterator 


istreambuf iterator 从 istream_buffer 读 取 字符 流 : 


template<typename C, typename Tr = char traits<C>> /Wiso.24.6.3 


class istreambuf iterator 


:public iterator<input_iterator tag, C, typename Tr::off type, 六 uvnspecifec*/, C>{ 


public: 
using char_ type = Ci; 


using traits_type = Tr; 


using int_type = typename Tr::int_type; 
using streambuf type = basic_streambuf<C,Tr>; 
using istream_type = basic_istream<C,Tr>; 


ja 
}; 


它 并 未 使 用 iterator 基 类 的 reference 成 员 ， 因 此 并 未 说 明 该 成 员 。 
如 果 你 将 一 个 istreambuf iterator 用 作 输 入 迭代 器 ， 其 效果 与 其 他 输入 迭代 器 别 无 二 
致 : 可 以 用 c=*p++ 从 输入 读 取 字符 流 : 


istreambuf_iterator<C,Tr> (iso.24.6.3 ) 


istreambuf _iterator p 分 ; 
istreambuf_iterator p {p2}; 
istreambuf iterator p {is}; 
istreambuf _iterator p {psb}; 
istreambuf_iterator p {nullptr}; 
istreamburf_iterator p {prox}; 


p. “istreambuf_iterator() 





c=*p 

p->m 
p=++p 
prox=p++ 
p.equal(p2) 
p==p2 
p!=p2 





p 为 流 末 尾 迭 代 器 ; 不 抛 出 异常 ; constexpr 
拷贝 构造 函数 ; 不 抛 出 异常 

p 为 is.rdbuf() 的 迭代 融 ; 不 抛 出 异常 

p 为 指向 istreambuf *psb 的 迭代 器 ; 不 抛 出 异常 
p 为 流 末 尾 迭 代 器 

p 指向 由 prox 指定 的 istreambuf; 不 抛 出 异常 
析 构 函数 

c 为 streambuf 的 sgetc() 返回 的 字符 

*p 的 成 员 m， 若 *p 是 一 个 类 对 象 的 话 
streambuf 的 sbumpc() 

令 prox 指向 与 p 相同 的 位 置 ; 然后 ++p 

p 和 p2 都 指向 流 末 尾 ， 或 都 不 是 ? 
p.equal(p2) 

!p.equal(p2) 








注意 ， 自 作 聪 明 地 比较 两 个 istreambuf_iterator 必然 失败 : 你 不 能 依赖 于 两 个 迭代 器 指向 相 


同 的 字符 ， 因 为 输入 是 在 一 直 进行 的 。 


38.6.3.2 ostreambuf iterator 


ostreambuf iterator 向 ostream_buffer 写 入 字符 流 : 


template<typename C, typename Tr = char traits<C>> // iso.24.6.4 


class ostreambuf iterator 


:public iterator<output_iterator_tag, void, void, void, void> { 


public: 
using char type = Ci; 


using traits_type = Tr; 


using streambuf_ type = basic_streambuf<C,Tr>; 
using ostream_type = basic_ostream<C,Tr>; 


hs 
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按 大 多 数 标准 来 衡量 ，ostreambuf iterator 的 操作 有 些 奇 怪 ， 但 最 终 效果 是 ， 如 果 你 将 一 
ostreambuf iterator 用 作 输 出 流 ， 甚 整体 效果 与 其 他 输出 流 一 样 : 我 们 可 以 用 *p++=c 向 输 
出 写 入 字符 流 。 


ostreambuf iterator<C,Tr> (iso.24.6.4 )( 续 ) 


ostreambuf _iterator p {fos}; p 为 os.rdbuf() 的 迭代 器 ; 不 抛 出 异常 
ostreambuf iterator p {psb}; p 为 ostreambuf *psb 的 迭代 融 ; 不 抛 出 异常 
p=c 若 !p.failed()， 调 用 streambuf 的 sputc(c) 
*p 什么 也 不 做 
++p 什么 也 不 做 
p++ 什么 也 不 做 
p.failed() p 的 流 缓 冲 区 上 的 sputc() 操作 已 达 eof ? 不 抛 出 异常 
38.7 建议 
[1] 若 用 户 自 定义 类 型 的 值 存在 有 意义 的 文本 表示 ， 可 为 其 定义 << 和 >> ; 38.1 节 


38.4.1 节 ，38.4.2 节 

[2] 用 cout 进行 正常 输出 ， 用 cerr 输出 错误 ; 38.1 节 。 

[3 ] 标准 库 提供 了 普通 字符 和 宽 字 符 的 iostream， 你 可 以 为 任意 类 型 的 字符 定 
iostream; 38.1 节 。 

[4】 标准 库 为 标准 IO 流 、 文 件 和 string 定义 了 标准 iostream; 38.2 节 。 

[5] 不 要 尝试 拷贝 一 个 文件 流 ; 38.2.1 节 。 

]」 二 进 制 IO 依赖 于 系统 ; 38.2.1 节 。 

[7 ] 在 使 用 文件 流 之 前 记得 检查 它 是 否 已 关联 到 文件 ; 38.2.1 节 

[ 8 ] 优先 选择 ifstream 和 ofstream 而 非 通用 的 fstream; 38.2.1 节 。 

[9] 用 stringfstream 进行 内 存 中 的 格式 化 ; 38.2.2 节 。 

[10]」 用 异常 机 制 捕 获 稀少 的 bad()-1O 错误 ; 38.3 节 。 

[11] 用 流 状态 fail 处 理 潜在 的 可 恢复 WO 错误 ; 38.3 节 。 

[12 ]】 为 了 定义 新 的 << 和 >> 你 无 需 修 改 istream 或 ostream; 38.4.1 市 

[ 13 ] 当 实 现 iostream 原 语 操作 时 ， 使 用 sentry; 38.4.1 节 。 

[ 14 ] 优先 选择 格式 化 输入 而 非 未 格式 化 的 、 底 层 的 输入 ; 38.4.1 节 

[15 ] 读 取 输入 存 人 string 不 会 导致 溢出 ; 38.4.1 市 

[ 16 ] 当 使 用 get()、getline() 和 read() 时 ， 要 小 心 结 束 标准 ; 38.4.1 节 
[17] >> 默认 忽略 空白 符 ; 38.4.1 节 。 

[18] 你 可 以 定义 行为 类 似 虚 函数 的 << (或 >>)， 其 行为 由 其 第 二 个 运算 对 象 所 决定 ; 
38.4.2.1 节 。 

[ 19 ] 优先 选择 操纵 符 而 非 状 态 标志 来 控制 TO; 38.4.3 节 。 

[20] 如 果 你 希望 混合 C 风 格 UVO 和 iostream-IO， 使 用 sync_with_stdio(ltrue) ; 
38.4.4 节 。 

[21] 使 用 sync_with_stdio(false) 优化 iostream; 38.4.4 节 

[ 22 ] 连接 流 来 实现 交互 式 LO; 38.4.4 节 。 
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[23 ]】 用 imbue() 来 令 iostream 反映 locale 的 “文化 差异 ”; 38.4.4 节 。 

[ 24 ] width() 说 明 只 应 用 于 紧 接 着 的 下 一 个 WO 操作 ; 38.4.5.1 节 。 

[ 25 ] precision() 说 明 应 用 于 后 续 所 有 浮 点 输出 操作 ; 38.4.5.1 节 。 

[26 ] 浮 点 格式 说 明 (如 scientific) 应 用 于 后 续 所 有 浮 点 输出 操作 ; 38.4.5.2 节 。 

[27 ] 为 使 用 接受 参数 的 标准 操纵 符 ， 要 #include <iomanip>; 38.4.5.2 节 。 

[28 ] 你 几乎 不 会 需要 flush(); 38.4.5.2 节 。 

[29 ] 除非 可 能 有 审美 趣味 上 的 原因 ， 否 则 不 要 使 用 endl; 38.4.5.2 节 。 

[30 ] 如 果 iostream 格式 化 变 得 令 人 厌烦 ， 编 写 你 自己 的 操纵 符 ; 38.4.5.3 节 。 

[31」 通过 定义 一 个 简单 的 函数 对 象 ， 你 可 以 实现 三 元 运算 符 的 效果 (和 效率 ) ; 
38.4.5.3 节 。 
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区 域 设 置 





入 国 问 禁 ， 入 乡 随 俗 。 





e 处 理 文化 差异 
e 类 locale 
命名 locale; 比较 string 
e 类 facet 
访问 locale 中 的 facet; 一 个 简单 的 用 户 自 定义 facet; locale 和 facet 的 使 用 
e 标准 facet 
string 比较 ; 数值 格式 化 ; 货币 格式 化 ; 日 期 和 时 间 格 式 化 ; 字符 分 类 ; 字符 编码 转 
换 ; 消息 
e 便利 接口 
字符 分 类 ; 字符 转换 ; 字符 串 转 换 ; 缓冲 区 转换 
e 建议 


39.1 处理 文化 差异 


一 个 locale 对 象 表示 一 组 文化 偏好 ， 例 如 ， 字 符 串 如 何 比较 、 人 类 可 读 的 数值 输出 格 
式 以 及 字符 在 外 存 中 的 表示 形式 。 区 域 设 置 (locale) 的 概念 是 可 扩展 的 ， 程序 员 从 而 可 以 
向 一 个 locale 添加 新 的 facet， 表 示 标 准 库 不 直接 支持 的 区 域 相关 的 实体 ， 如 邮政 编码 和 电 
话 号 码 。locale 在 标准 库 中 的 主要 用 途 是 控制 输出 到 ostream 的 信息 的 呈现 形式 以 及 格式 化 
从 istream 读 取 的 数据 。 

本 章 描 述 如 何 使 用 locale 、 如 何 用 facet 构造 locale 以 及 locale 如 何 影 响 IO 流 。 

区 域 设置 不 只 是 一 个 C++ 概念 ， 大 多 数 操作 系统 和 应 用 环境 都 有 区 域 设 置 的 概念 。 这 
个 概念 原则 上 是 系统 中 所 有 程序 所 共享 的 ， 而 与 编写 程序 的 语言 无 关 。 因 此 ， 我们 可 以 将 
C++ 标准 库 的 区 域 设置 概念 看 作 一 种 标准 的 、 可 移植 的 方法 ， 它 令 C++ 程序 能 访问 不 同系 
统 中 表示 形式 差异 巨大 的 信息 。 一 个 C++ locale 就 是 一 个 系统 信息 访问 接口 ， 这 些 信息 在 
ee 

考虑 编写 一 个 会 在 多 个 国家 使 用 的 程序 。 编 写 这 种 程序 的 编程 风格 通常 被 称 为 国际 化 
bie 强调 程序 在 多 个 国家 使 用 ) 或 区 域 化 (localization， 强 调 程 序 适应 区 域 
情况 )。 程 序 操纵 的 很 多 实体 在 这 些 国家 中 习惯 上 有 不 同 的 表现 形式 ， 为 处 理 此 问题 我 们 可 
在 编写 IO 例 程 时 考虑 这 方面 的 因素 。 例 如 : 

void print_date(const Date& d) 咱 用 恰当 的 格式 打印 


switch(where_am 上){  // 用 户 自 定义 风格 指示 器 
case DK: li 如 7.marts 1999 
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cout << d.day() << "." << dk_month[d.month()] << " " << d.year(); 


break; 

case ISO: 1 如 1999-3-7 
cout << d.year() <<"- "<< d.month() << "/" << d.day(); 
break:; 

case US: 省 如 3/7/1999 
cout << d.month() << “/" << d.day{) << "/" << d.year(); 
break:; 


} 
这 种 编程 风格 可 以 实现 正确 输出 ,但 代码 丑陋 、 不 易 维 护 。 特 别 是 ,我们 必须 在 程序 中 一 致 
地 使 用 这 种 风格 以 确保 所 有 输出 都 正确 调整 以 适应 区 域 习 惯 。 如 果 我 们 希望 添加 一 种 新 的 日 
期 输出 格式 ， 就 必须 修改 应 用 代码 。 更 糟 的 是 ， 日 期 输出 格式 只 不 过 是 众多 文化 差异 中 的 一 
个 例子 而 已 。 

因此 ， 标 准 库 提供 一 种 可 扩展 的 文化 习惯 处 理 方法 。iostream 库 依赖 此 框架 处 理 内 置 
和 用 户 自 定义 类 型 ( 见 38.1 节 )。 例如， 考虑 用 一 个 简单 循环 拷贝 (日 期 ， 双 精度 ) 值 对 ， 
它们 可 能 表示 一 系列 的 测量 值 或 一 组 交易 记录 : 

void cpy(istream& is, ostream& os)// 拷 贝 (日 期 ， 双 精度 ) 流 


Date dj; 
double volume; 


while (is >> d >> volume) 
os <<d <<''<< volume << "\n'; 


} 
当然 ， 一 个 真实 程序 读 取 数 据 后 会 进行 一 些 处 理 再 输出 ， 而 且 理 想 情 况 在 错误 处 理 方面 也 更 
细致 。 

我 们 如 何 才 能 令 此 程序 按 法 国 习 惯 (在 浮 点 数 中 用 逗号 表示 小 数 点 ; 例如 ，12,5 表示 
十 二 又 二 分 之 一 ) 读 取 一 个 文件 并 按 美国 习惯 输出 呢 ? 我们 可 以 定义 locale 和 IO 操作 ,来 
让 cpy() 实现 这 种 文化 习惯 间 的 转换 : 


void flistreamg& fin, ostream& fout, istream& fin2, ostream& fout2) 








{ 
fin.imbue(locale{"en_US.UTF-8"}); 川 美国 英语 
fout.imbue(locale{"fr_FR.UTF-8")}); 川 法语 
cpy(fin,fout); // 读 取 美 国 英语 ， 输 出 法 语 
hs 
fin2.imbue(locale{"fr_FR.UTF-8"}); 作法 语 
fout2.imbue(locale{"en_US.UTF-8"}); ”// 美 国 英 语 
cpy(fin2,fout2); // 读 取 法 语 ， 输 出 美国 英语 
Ms 

} 

给 定 下 面 的 流 : 


Apr 12, 1999 1000.3 
Apr 13, 1999 345.45 
Apr 14, 1999 9688.321 


3 juillet 1950 10,3 
3juillet 1951 134,45 


锡 39 香 区 域 雁 村 211 





3 juiliet 1952 67,9 


此 程序 会 输出 : 
12 avril 1999 1000,3 


13 avril 1999 345,45 
14 avril 1999 9688,321 


July 3, 1950 10.3 
July 3, 1951 134.45 
July 3, 1952 67.9 


本 章 大 部 分 剩余 内 容 将 专注 于 描述 达成 这 一 目标 的 机 制 并 解释 如 何 使 用 这 些 机 制 。 但 是 ， 大 
多 数 程序 员 很 少 会 处 理 locale 的 细节 ， 而 且 从 不 会 显 式 操 纵 locale。 他 们 最 多 简单 地 获取 一 
个 标准 locale 并 将 其 赋予 流 ( 见 38.4.5.1 节 )。 

区 域 化 (国际 化 ) 的 概念 很 简单 ， 但 现实 中 的 限制 令 locale 的 实现 相当 复杂 : 

| 1] locale 封装 了 文化 习惯 ， 如 日 期 的 表现 形式 。 这 些 习 惯 的 差异 微妙 且 不 成 系统 ， 
它们 本 身 与 程序 设计 语言 无 关 ， 因 此 语言 不 可 能 将 它们 标准 化 。 
| 2 ] locale 的 概念 必须 是 可 扩展 的 ， 因 为 穷 举 对 不 同 C++ 用 户 很 重要 的 所 有 文化 习惯 
是 不 可 行 的 。 

[3] 人 们 对 使 用 locale 的 操作 (如 VO 和 排序 ) 有 较 高 的 运行 时 效率 要 求 。 

[4」 大 多 数 程 序 员 都 希望 从 “做 正确 的 事 ” 的 语言 特性 受益 而 又 不 必 确 切 了 解 “正确 

的 事 ” 是 什么 或 是 如 何 实现 的 ，locale 对 他 们 必须 是 不 可 见 的 。 

[5 ] locale 必须 能 处 理 超出 标准 之 外 的 文化 敏感 信息 ， 以 供 语言 特性 的 设计 者 使 用 。 

用 来 构建 locale 以 及 令 其 更 易 使 用 的 机 制 形成 了 一 种 自 成 一 体 的 小 型 编程 语言 。 

一 个 locale 由 若干 facet 构成 ， 每 个 facet 控制 单一 方面 ， 如 输出 浮 点 值 所 用 的 标点 字 
符 (decimal_point() ; 见 39.4.2 节 ) 以 及 读 取 货 币值 的 格式 (moneypunct ; 见 39.4.3 节 )。 
一 个 facet 就 是 一 个 locale::facet ( 见 39.3 节 )) 的 派生 类 的 对 象 。 我 们 可 以 将 一 个 locale 
看 作 一 个 facet 的 容器 ( 见 39.2 节 和 39.3.1 节 ) 





39.2 类 locale 
类 local 及 其 相关 特性 都 在 <locale> 中 。 


locale 成 员 (iso.22.3.1 ) 


locale loc{} loc 成 为 当前 全 局 区 域 设置 的 一 个 副本 ; 不 抛 出 异常 

locale loc {loc2); 拷贝 构造 函数 : loc 保存 loc2 的 副本 ; loc.name()==loc2.name(); 不 抛 出 异常 

locale loc {s}; loc 初始 化 为 名 为 s 的 locale ; s 可 以 是 一 个 string 或 一 个 C 风格 字符 串 ; loc. 
name()==s; 显 式 构造 也 数 

locale loc {loc2,s,cat}; loc 成 为 loc2 的 副本 ， 类 别 为 cat 的 facet 除 外， 它 找 贝 自 locale{s} ; s 可 以 
是 一 个 string 或 一 个 C 风格 字符 串 ; 若 loc2 有 名 字 ， 则 loc 也 有 名 字 

locale loc {loc2,pf}; loc 成 为 loc2 的 副本 ，facet*pf 除外 ( 若 pfl=nullptr); loc 没有 名 字 

locale loc {loc2,loc3,cat}; loc 成 为 loc2 的 副本 ， 类 别 为 cat 的 facet 除 外， 它 拷贝 自 loc3 ; 着 loc2 和 
loc3 有 名 字 ， 则 loc 有 相同 的 名 字 

loc.“locale() 析 构 函数 ; 非 虚 函 数 ; 不 抛 出 异常 





loc2=loc 赋值 操作 : loc2 为 loc 的 副本 ; 不 抛 出 异常 
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( 续 ) 
locale 成 员 (iso.22.3.1 ) 
loc3=loc.combine<F>(loc2) “loc3 成 为 loc 的 副本 ， 类 别 为 F 的 facet 除外 ， 它 拷贝 自 loc2; loc3 没有 名 字 





s=loc.name() s 为 loc 的 locale 的 名 字 或 * 

loc==loc2 loc 是 与 loc2 一 样 的 locale 吗 ? 

loc!=loc2 !(loc==loc2) 

loc()(s,s2) 用 loc 的 collate<C> facet 比较 s 和 s2 (basic_string<C> 类 型 ) 
loc2=global(loc) 将 全 局 locale 设置 为 loc; loc2 为 旧 的 全 局 locale 
loc=classic() loc 为 经 典 “C” 区 域 设置 


如 果 一 个 给 定名 字 的 locale 或 facet 所 指向 的 locale 并 不 存在 ， 则 用 此 名 访问 locale 的 操 
作 会 抛 出 一 个 runtime_error。 

locale 的 命名 机 制 有 些 奇怪 。 当 你 用 一 个 locale 和 一 个 facet 创建 一 个 新 locale 时 ， 若 
结果 locale 有 名 字 ， 则 此 名 是 由 具体 C++ 实现 定义 的 。 通 常 ， 这 个 名 字 包 含 贡献 了 最 多 
facet 的 locale 的 名 字 。 对 于 无 名 locale，name() 返回 "*"。 

我 们 可 以 将 一 个 locale 看 作 一 个 map<id,facet*> 的 接口 ， 即 ， 它 允许 我 们 用 一 个 
locale::id 查找 对 应 的 locale::facet 派生 类 对 象 。locale 的 实际 实现 是 这 一 思想 的 一 种 高 效 
变 体 ， 其 内 存 布局 可 能 像 下 面 这 样 : 





collate<char>: 





locale: compare() 
一 上 一 一 一 hash() 








numpunct<char>: 








decimal_point() 
truename({) 











上 图 中 的 collate<char> 和 numpunct<char> 都 是 标准 库 facet ( 见 39.4 节 )， 所 有 facet 都 派 
生 自 locale::facet。 

locale 可 以 自由 、 高 效 地 拷贝 。 因 此 , locale 几乎 必然 实现 为 一 个 特例 化 
map<id,facet*> 的 句柄 ， 这 构成 了 实现 的 主体 。locale 中 的 facet 必须 能 快速 访问 ， 因 
此 ， 特 例 化 的 map<id,facet*> 必须 进行 类 似 数 组 的 快速 访问 优化 。 我 们 可 以 用 use_ 
facet<Facet>(loc) 语法 访问 locale 中 的 facet; 见 39.3.1 节 。 

标准 库 提 供 了 丰富 的 facet。 为 了 帮助 程序 员 按 逻辑 分 组 使 用 facet， 标 准 facet 被 分 为 
若干 类 别 ， 如 numeric 和 collate ( 见 39.4 节 ): 


facet 类 别 (iso.22.3.1 ) 





collate 如 collate; 见 39.4.1 节 

ctype 如 ctype; 见 39.4.5 节 

numeric 如 num_put、num_get、numpunct; 见 39.4.2 节 
monetary money_put、money_get、moneypunct; 见 39.4.3 节 


time 如 time_put、time_get; 见 39.4.4 节 
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( 续 ) 
facet 类 别 (iso.22.3.1 ) 
messages messages; 见 39.4.7 节 
all collate | ctype | monetary | numeric | time | messages 
none 


标准 库 并 未 提供 为 新 创建 的 locale 指定 名 字 字 符 串 的 特性 。 名 字 字 符 串 或 者 在 程序 执行 环 
境 中 定义 ,或 者 由 locale 的 构造 函数 组 合 相 关 名 字 创 建 。 

程序 员 可 以 替换 来 自 现 有 类 别 的 facet ( 见 39.4 节 和 39.4.2.1 节 )， 但 无 法 定义 新 类 别 。 
“类 别 ” 的 概念 只 用 于 标准 库 facet， 且 不 可 扩展 。 因 此 ， 一 个 facet 不 必 属 于 任何 类 别 ， 很 
多 用 户 自 定义 facet 也 确实 如 此 。 

如 果 一 个 locale x 没有 名 字 字 符 串 ， 则 locale::global(x) 是 否 影响 C 全 局 区 域 设 置 是 未 
定义 的 。 这 意味 着 一 个 C++ 程序 不 可 能 以 可 靠 且 可 移植 的 方式 将 C 的 区 域 设 置 设 定 为 一 个 
并 非 来 自 执行 环境 的 区 域 设 置 ， 也 不 存在 标准 方法 在 C 程序 中 设 定 C++ 全 局 区 域 设置 ( 除 
非 调用 一 个 C++ 函数 )。 在 一 个 C/C++ 混合 程序 中 ， 若 使 得 C 的 全 局 区 域 设 置 与 global() 
不 同 ， 则 很 容易 出 错 。 

到 目前 为 止 ，locale 主要 隐 式 用 于 IO 流 中 。 每 个 istream 和 ostream 都 有 其 专 有 的 
locale。 在 创建 流 时 ， 其 locale 默认 为 全 局 locale ( 见 39.2.1 节 )。 我 们 可 以 用 imbue() 操 
作 设 置 流 的 locale， 还 可 以 用 getloc() 提取 流 的 locale 的 拷贝 ( 见 38.4.5.1 节 )。 

设置 全 局 locale 不 会 影响 已 存在 的 IO 流 ; 它们 仍 使 用 这 之 前 被 赋予 的 locale。 


39.2.1 命名 locale 


locale 可 从 另 一 个 locale 以 及 从 facet 创建 。 最 简单 的 创建 locale 的 方法 是 拷贝 一 个 已 有 
locale。 例 如 : 


locale loc1; 咱 拷 贝 当 前 全 局 locale 

locale loc2 {""}; /拷贝 “用 户 优选 的 locale” 

locale loc3 {"C"); 咱 拷贝 “C” locale 

locale loc4 {locale::classic()}; 川 拷贝“C” locale 

locale loc5 {"POSIX"); 川 拷贝 名 为 “POSIX” 的 locale 

locale loc6 {"Danish_Denmark.1252"}; /拷贝 名 为 “Danish Denmark.1252” 的 locale 
locale loc7 {"en_US.UTF-8"}; 儿 拷贝 名 为 “en US.UTF-8” 的 locale 


locale{"C"} 的 含义 由 “经 典 ”C locale 标准 定义 ; 此 区 域 设 置 的 使 用 贯穿 本 书 。 其 他 
locale 名 是 由 具体 C++ 实现 定义 的 。 

locale{"} 被 认为 是 “用 户 优选 的 区 域 设 置 ” 。 此 locale 是 在 程序 执行 环境 中 用 非 语 言 学 
的 方法 设置 的 。 因 此 ， 为 了 查看 你 当前 的 “优选 区 域 设置 ”， 应 编写 代码 如 下 : 


cout << loc.name!() << \n ; 

在 我 的 Windows 笔记 本 上 ， 我 得 到 了 : 
English_United States.1252 

在 我 的 Linux 盒子 上 ， 我 得 到 了 : 
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en_US.UTF~8 


区 域 设置 的 名 字 并 未 被 C++ 标准 化 ， 而 是 由 很 多 组 织 ， 如 POSIX 和 微软 ， 维 护 着 他 们 自己 
的 (不同 的 ) 标准 ， 这 些 标准 库 会 跨越 不 同 的 编程 语言 。 例 如 : 





GNU 区 域 设置 名 示例 (基于 POSIX) 











ja_JP 日 语 

da_DK 丹麦 语 

en_DK 丹麦 英语 

de_CH 瑞士 德语 

de_DE 德国 德语 

en_GB 英国 英语 

en_US 美国 英语 

fr_CA 加 拿 大 法 语 

de_DE 德国 德语 

de_DE@euro 德国 德语 ， 欧 元 符号 为 € 
de_DE.utf8 使 用 UTF-8 的 德国 德语 
de_DE.utf8@euro 使 用 UTF-8 的 德国 德语 ， 欧 元 符号 为 € 





POSIX 建议 的 区 域 设置 名 字 格 式 包 括 小 写 语言 名 ,后 接 可 选 的 大 写 国家 名 以 及 可 选 的 编码 
说 明 符 ， 例 如 ，sv_FI@euro (芬兰 瑞典 语 ， 包 括 欧 元 符号 )。 


微软 区 域 设 置 名 示例 
Arabic_Qatar.1256 
Basque_Spain.1252 





Chinese_Singapore .936 
English_United Kingdom.1252 
English_United States.1252 
French_Canada.1252 
Greek_Greece .1253 

Hebrew _lsrael.1255 
Hindi_India.1252 


Russian_Russia.1251 


微软 的 区 域 设置 名 以 语言 名 开头 ， 后 接 国家 名 和 一 个 可 选 的 编码 页 号 。 所 谓 编码 页 (code 
page) 就 是 一 个 命名 的 (或 编号 的 ) 字符 编码 方案 。 

大 多 数 操作 系统 都 提供 了 为 程序 设 定 默 认 区 域 设 置 的 方法 ， 这 通常 是 通过 设置 诸如 
LC_ALL、LC_COLLATE 以 及 LANG 这 种 环境 变量 来 实现 的 。 通 常 ， 用 户 在 首次 使 用 系统 
时 会 选择 适合 的 区 域 设 置 。 例 如 ， 如 果 某 人 配置 一 个 Linux 系统 使 用 阿根廷 西班牙 语 作为 
默认 设置 ， 就 会 发 现 locale{"} 意味 着 locale{"es_AR"}。 但 是 ， 这 些 名 字 并 非 跨 平台 标准 
化 的 。 因 此 ， 为 了 在 特定 系统 上 使 用 命名 locale， 程 序 员 必 须 参 考 系 统 文 档 ， 并 进行 一 些 

避免 在 程序 代码 中 般 入 locale 名 通常 是 一 个 好 主意 。 硬 编码 文件 名 或 系统 常量 会 限制 
程序 的 可 移植 性 ， 而 且 希 望 调整 程序 适应 新 环境 的 程序 员 常 常会 被 迫 去 查找 并 修改 这 些 值 。 
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硬 编 码 locale 名 字符 串 也 会 有 类 似 的 不 良 后 果 。 更 好 的 方式 是 从 程序 的 执行 环境 中 获取 
locale (例如 ,使 用 locale{""} 或 读 取 文件 )。 此 外 ， 程 序 也 可 以 要 求 用 户 键入 字符 串 来 指定 
其 他 的 区 域 设 置 。 例 如 : 


void user set locale(const string& question) 


{ 
cout << question; /1 例如 ,“ 如 果 你 希望 使 用 不 同 locale， 请 输入 其 名 称 ” 
string s; 
cin >> s; 
locale::global(locale{s}); // 按 用 户 指定 内 容 设置 全 局 locale 


对 于 非 专家 用 户 而 言 ， 让 其 在 一 个 候选 列表 中 选择 通常 是 更 好 的 方法 。 若 想 编写 责 数 实现 这 
一 目的 ， 就 必须 了 解 系统 在 哪里 以 及 如 何 保存 locale。 例 如 ， 很 多 Linux 系统 将 其 locale 保 
存在 目录 /usr/share/locale 中 。 

如 果 字 符 串 实 参 并 未 指向 一 个 已 定义 的 locale， 构 造 函 数 会 抛 出 runtime_error 异常 
( 见 30.4.1.1 节 )。 例 如 : 


void set loc(locale& loc, const char: name) 
try 
{ 


loc = locale{name)}; 


catch (runtime error&) { 
cerr << "locale 
hs 
} 
如 果 一 个 locale 有 名 字 字 符 串 ,name() 调用 会 返回 此 字符 串 。 若 没有 ，name() 会 返 
回 string("*")。 名 字 字 符 串 主要 用 来 引用 保存 在 执行 环境 中 的 locale， 此 外 ， 名 字 字 符 串 还 
可 用 来 帮助 调试 。 例 如 : 


void print_locale_names(const locale& my _loc) 


{ 
cout << "name of current global locale: " << locale().name() << "\n"; 
cout << "name of classic C locale: " << locale::classic().name() << "\n"; 
cout << "name of ‘user's preferred locale": " << locale("").name() << “"\n"; 
cout << "name of my iocale: " << my _loc.name() << "\n"; 

} 


39.2.1.1 构造 新 locale 
通过 向 现 有 locale 添加 或 替换 facet， 我 们 可 以 创建 新 的 locale。 一 个 新 locale 通常 是 
一 个 已 有 locale 的 简单 变 体 。 例 如 : 


void f(const locale& loc, const My_money_io* mio) JMy_money io 定义 在 39.4.3.1 节 中 


{ 
iocale loc1(locale{"POSIX"},loc,locale::monetary); // 使 用 来 自 loc 的 货币 facet 
locale loc2 = locale(locale::classic(), mio); lclassic 加 mio 


} 
此 处 ，loc1 是 对 POSIX locale 的 拷贝 的 修改 ,使 用 了 loc 的 货币 facet ( 见 39.4.3 节 )。 类 
似 地 ,loc2 是 对 C locale 的 拷贝 的 修改 ， 使 用 了 My_money_io ( 见 39.4.3.1 节 )。 结 果 
locale 可 表示 如 下 : 
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collate<char>: 


classic(): comparel() loc2: 
肚 i ol 


numpunct<char>: 


decimal point() 
curr_symboil() 


My_money_io: 
decimal point() 
curr symbol() 


如 果 Facet* 实 参 (本 例 中 为 My money io*) 为 nullptr， 则 结果 locale 即 为 locale 实 参 的 
简单 拷贝 

在 构造 localet{loc, 中 ， 参 数 f 必 须 指 定 一 个 特定 的 facet 类 型 。 普 通 facet* 是 不 够 的 。 
例如 : 


void g(const locale::facet: mio1, const money_put<char>* mio2) 





locale loc3 = locale(locale::classic(), mio1); 几 错 误 : facet 类 型 未 知 
locale loc4 = locale(locale::classic(), mio2); 咱 确 : facet 类 型 已 知 (moneyput<char>) 
Wi 

} 


locale 使 用 Facet* 实 参 的 类 型 在 编译 时 确定 facet 的 类 型 。 具 体 来 说 ，locale 实现 利用 
facet 的 标识 类 型 一 一 facet::id ( 见 39.3 节 ) 一 一 在 locale 中 查找 此 facet ( 见 39.3.1 节 )。 构 

template<class Facet> locale(const locale& x, Facet: f); 
为 locale 提供 facet， 这 是 C++ 语言 为 程序 员 提 供 的 唯一 方法 。 其 他 locale 由 实现 者 以 命 
名 locale 的 方式 提供 ( 见 39.2.1 节 )。 命名 区 域 设置 可 以 从 程序 的 执行 环境 提取 。 了 解 其 实 
现 机 制 的 程序 员 或 许可 以 添加 新 的 locale。 

locale 构造 孔 数 的 设计 使 得 每 个 facet 的 类 型 或 者 能 通过 ( Facet 模板 参数 的 ) 类 型 推 
断 获得 ， 或 者 来 自 于 男 一 个 locale (已 知 其 类 型 )。 指 定 category 实 参 可 以 间接 地 指出 facet 
的 类 型 ， 因 为 locale 知道 分 类 facet 的 类 型 。 这 意味 着 locale 类 可 以 (也 确实 这 样 做 了 ) 追 
踪 facet 的 类 型 ， 以 便 能 以 最 小 的 代价 来 操纵 它们 。 

locale 用 成 员 类 型 locale::id 来 标识 facet 类 型 ( 见 39.3 节 )。 

C++ 不 提供 修改 locale 的 方法 ， 而 是 通过 locale 操作 提供 从 已 有 locale 创建 新 locale 
的 方法 。locale 创建 后 即 不 可 变 对 运行 时 效率 而 言 是 很 重要 的 ， 这 人 允许 locale 的 使 用 者 
调用 facet 的 虚 函 数 并 缓存 返回 值 。 例 如 ， 一 个 istream 可 以 不 必 每 次 读 取 数值 时 都 调用 
decimal_point()* 以 获知 哪个 字符 用 来 表示 小 数 点 ， 也 不 必 每 次 读 取 一 个 bool 值 时 都 调用 
truename()* 以 了 解 true 是 如 何 表示 的 ( 见 39.4.2 节 )。 只 有 对 流 调用 imbue() ( 见 38.4.5.1 
节 ) 才 会 导致 这 些 调用 返回 一 个 不 同 值 。 


39.2.2 比较 string 
根据 locale 比较 两 个 string 可 能 是 locale 在 IO 之 外 最 常见 的 用 途 了 。 因 此 ，locale 
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直接 提供 了 此 操作 ， 从 而 用 户 不 必 从 collate facet 构建 自己 的 比较 函数 ( 见 39.4.1 节 )。 此 
string 比较 函数 定义 为 locale 的 operator()()。 例 如 : 


void user(const string s1, const string s2, const locale& my_locale) 


{ 
if (my_locale(s,s2)) { /根据 my_locale, s<s2? 
His 


} 
} 
以 () 的 形式 定义 比较 函数 ， 使 其 可 直接 用 作 谓 词 ( 见 4.5.4 节 )。 例 如 : 
void f(vector<string>& v, const locale& my _iocale) 


{ 
sort(v.begin(),vend()); 咱 用 < 比较 元 素来 进行 排序 
I 


sort(v.begin(),v.end(),my_locale);” /根据 my_locale 的 规则 进行 排序 
fh 


} 
标准 库 sort() 默认 使 用 < 确定 实现 字符 集 上 数值 的 排序 顺序 ( 见 32.6 节 和 31.2.2.1 节 ) 


39.3 类 facet 


一 个 locale 就 是 一 个 facet 集合 。 一 个 facet 表示 一 个 特定 的 文化 侧面 ， 例 如 数值 输 
出 时 如 何 表示 (num_put)， 如 何 从 输入 读 取 日 期 (time_get) 以 及 在 文件 中 如 何 保存 字符 
(codecvt)。39.4 节 列 出 了 标准 库 facet。 

用 户 可 以 定义 新 的 facet， 例 如 确定 季节 名 如 何 打印 的 facet ( 见 39.3.2 节 )。 

facet 在 程序 中 表示 为 std::locale::facet 派生 类 的 对 象 。 类 似 其 他 locale 特性 ，facet 
也 定义 在 <locale> 中 : 


class iocale::facet { 
protected: 
explicit facet(size_t refs = 0); 
virtual “facet(); 
facet(const facet&) = delete; 
void operator=(const facet&) = delete; 
}; 
类 facet 设 计 为 无 公有 函数 的 基 类 。 其 构造 函数 是 protected 的 ， 以 防止 创建 “普通 facet” 
对 象 ， 其 析 构 函数 是 virtual 的 ， 以 确保 派生 类 对 象 正确 销毁 。 
facet 一 般 通过 保存 在 locale 中 的 指针 来 管理 。 传 递 给 facet 构造 函数 一 个 参数 0 表示 
locale 应 在 facet 的 最 后 一 个 引用 释放 后 删除 它 。 反 之 ， 非 零 参数 确保 locale 永远 也 不 会 删 
除 facet。 在 极 少数 情况 下 ，facet 的 生命 期 由 程序 员 直 接 控制 而 不 是 通过 locale 间接 控制 ， 
此 时 非 零 参 数 就 很 有 意义 了 。 
每 种 facet 接口 都 必须 有 独立 的 id: 
class locale::id { 
public: 
id(); 
void operator=(const id&) = delete; 
id(const id&) = delete; 
上 


用 户 使 用 id 为 每 个 提供 新 facet 接口 的 类 定义 一 个 id 类 型 的 static 成 员 (例如 ， 见 39.4.1 
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节 )。locale 机 制 用 id 标识 facet ( 见 39.2 节 和 39.3.1 节 )。 在 显而易见 的 locale 实现 中 ，id 
用 作 facet 指针 向 量 的 索引 ， 从 而 实现 高 效 的 map<id,facet*>。 
用 来 定义 (派生 ) facet 的 数据 定义 在 派生 类 中 。 这 意味 着 定义 facet 的 程序 员 对 数据 有 
facet 是 不 可 变 的 ， 因 此 一 个 用 户 自 定义 facet 的 所 有 成 员 函 数 都 应 定义 为 const。 
39.3.1 访问 locale 中 的 facet 
我 们 用 两 个 模板 函数 访问 locale 的 facet: 
非 成 员 locale 函数 (iso.22.3.2 ) 


f=use_facet<F>(loc) f 是 一 个 引用 ， 指 向 loc 中 的 F; 阁 loc 不 包含 F， 抛 出 bad_cast 
has_facet<F>(loc) loc 包含 facet F 吗 ? 不 抛 出 异常 








将 这 两 个 函数 理解 为 在 其 locale 实 参 中 查找 其 模板 参数 F。 也 可 以 将 use_facet 理解 为 一 种 
locale 到 特定 facet 的 显 式 类 型 转换 ( cast)， 这 是 可 行 的 ， 因 为 对 于 一 个 给 定 的 facet 类 型 ， 
一 个 locale 只 能 有 一 个 该 类 型 的 facet。 例 如 : 


void ftconst locale& my _locale) 


{ 
char c = use facet<numpunct<char>>(my_iocale).decimal_point() /| 使 用 facet 
i 
if (has_facet<Encrypt>(my_locale)) { /my _ locale 包含 一 个 埃及 facet? 
const Encrypt& f = use facet<Encrypt>(my locale); /提取 埃及 facet 
const Crypto c =f.get_crypto(); 川 使 用 埃及 facet 
Hs 
} 
hl. 
} 


标准 facet 保证 可 用 于 所 有 locale ( 见 39.4 节 )， 因 此 我 们 无 须 用 has_facet 检查 标准 facet。 

一 种 看 待 facet::id 机 制 的 方式 是 一 种 编译 时 多 态 的 优化 实现 。 使 用 dynamic_cast 可 
以 获得 与 use_facet 非常 相似 的 效果 。 但 是 ， 特 例 化 的 use_facet 可 以 实现 得 比 通用 的 
dynamic_cast 高 效 得 多 。 

一 个 id 标识 了 一 个 接口 和 一 种 行为 而 非 一 个 类 。 即 ， 如 果 两 个 类 有 完全 相同 的 接口 并 
实现 了 相同 的 语义 (就 locale 而 言 )， 它 们 应 该 被 相同 的 id 所 标识 。 例 如 ， 在 一 个 locale 
中 ，collate<char> 和 collate_byname<char> 是 可 互 换 的 ， 因 此 它们 都 被 collate<char>::id 
所 标识 ( 见 39.4.1 节 )。 

如 果 我 们 定义 一 个 具有 新 接口 的 facet 一 一 例如 f() 中 的 Encrypt 一 一 就 必须 定义 一 个 对 
应 的 id 来 标识 它 ( 见 39.3.2 节 和 39.4.1 节 )。 


39.3.2 一 个 简单 的 用 户 自 定义 facet 


标准 库 为 文化 差异 的 最 关键 领域 提供 了 标准 facet， 例 如 字符 集 和 数值 WO。 为 了 在 考 
察 facet 机 制 时 不 考虑 广泛 使 用 的 类 型 的 复杂 性 及 伴随 的 效率 问题 ， 我 首先 为 一 个 非常 简单 
的 用 户 自 定义 类 型 设计 一 个 facet: 


笋 39 蓝 区 域 座 置 219 








enum Season { spring, summer, fall, winter }; // 很 简单 的 用 户 自 定义 类 型 


此 处 勾勒 的 1/O 风格 经 过 细微 变化 即 可 用 于 大 多 数 简单 的 用 户 自 定义 类 型 : 


class Season_ io : public locale::facet { 


public: 
Season io(int i = 0) : locale::facet{i} {} 
“Season io() {} 儿 为 了 能 销毁 Season io 对 象 ( 见 39.3 节 ) 
virtual const string& to_str(Season x) const = 0; lx 的 字符 串 表 示 


virtual bool from_str(const string& s, Season& xj const = 0; // 将 s 所 表示 的 Season 放置 于 x 中 


static locale::id id; /facet 标识 对 象 ( 见 39.2 节 ，39.3 节 ，39.3.1 节 ) 

} 

locale::id Season io::id; // 定义 标识 对 象 
为 简单 起 见 ， 我 们 限制 此 facet 只 处 理 char 的 string。 

类 Season_ io 为 所 有 Season_io facet 提供 了 一 个 通用 且 抽 和 象 的 接口 。 为 了 定义 一 个 
特定 locale 的 Season 的 IO 呈现 方式 ， 我 们 从 Season_io 派生 一 个 类 ， 并 定义 恰当 的 to_ 
str() 和 from_str()。 

输出 一 个 Season 很 简单 。 如 果 流 具有 Season_io facet， 我 们 可 以 用 它 将 季节 值 转换 
为 字符 串 。 如 果 不 具备 ， 我 们 可 以 输出 Season 的 int 值 : 


ostream& operator<<(ostream& os, Season x) 
locale loc {0s.getloc()}; /提取 流 的 locale ( 见 38.4.4 节 ) 


if (has_facet<Season_io>(ioc)) 
return os << use_facet<Season io>(loc).to_str(x); /字符 串 表 示 
return os << static_cast<int>(x); /整数 表示 


} 
为 了 追求 最 高 效率 和 最 大 灵活 性 ， 标 准 facet 倾 向 于 直接 操纵 流 缓冲 区 ( 见 39.4.2.2 节 
和 39.4.2.3 节 )。 但是， 对 一 个 简单 的 用 户 自 定义 类 型 ， 如 Season， 没有 必要 陷入 到 
streambuf 这 个 抽象 层次 上 。 

一 如 以 往 ， 输 入 比 输出 稍微 复杂 些 : 


istream& operator>>(istream& is, Season& x) 


{ 
const locale& loc {is.getioc()}; /1 提取 流 的 locale ( 见 38.4.4 节 ) 


if (has_facet<Season io>(loc)) { 
const Season io& f {use_facet<Season io>(loc)}; // 获 取 locale 的 Season io facet 


string buf; 
if (!(is>>buf && ffrom_str(buf,x))) /1/ 读 取 字 符 串 表示 
is.setstate(ios_base::failbit); 
return is; 
} 
int i; 
is >> ji; // 读 取 数 值 表 示 
x= static _cast<Season>(i); 
return is; 


220 伪 四 部 分 村 准 座 





错误 处 理 很 简单 ， 遵 循 了 与 内 置 类 型 一 样 的 风格 。 即 ， 如 果 输 入 字符 串 不 表示 所 选 locale 
中 的 某 个 Season， 就 将 流 置 于 fail 状 态 。 如 果 异 常 被 启用 ， 则 会 导致 地 出 一 个 ios_ 
base::failure 异常 ( 见 38.3 节 )。 

下 面 是 一 个 简单 的 测试 程序 : 


int main() 
/一 个 简单 的 测试 程序 


{ 
Season x; 
咱 使 用 默认 locale (无 Season io facet) 意味 着 整数 IO: 
Cin >> x; 
cout << x << endl; 
locale loc{(locale(),new US_season _ iof{}); 
cout.imbue(loc); 外 使 用 有 Season_ io facet 的 locale 
cin.imbuel(loc); 川 使 用 有 Season io facet 的 locale 
cin >> x; 
cout << x << endl; 
} 
给 定 输入 
阔 
summer 
程序 会 输出 : 
2 
summer 


为 了 达到 这 一 效果 ， 我们 必须 从 Season_io 派生 一 个 类 US_season io， 并 定义 季节 的 恰 
当 字 符 捉 表示 : 
class US season io : public Season iof{ 
static const string seasons[]; 
public: 
const string& to_str(Season) const; 
bool from_str(const string&, Season&) const; 


/| 注意 : 无 US_season io::id 


}; 
const string US_season io::seasons[] ={ 
"spring”, 
" Summer ， 
"fall”, 
"winter” 


中 
然后 ， 我 们 覆盖 Season_io 中 负责 字符 串 表 示 和 枚 举 值 之 间 转 换 的 函数 : 


const string& US_season io::to_str(Season x) const 
{ 
if (x<spring || winter<x) { 
static const string ss = "no-such-season"; 
return ss; 
} 


return seasons[x]; 
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bool US_season io::from_str(const string& s, Season& x) const 


{ 
const string* p = find(begin(seasons),end(seasons),s); 
if (p==end) 
return false; 
x= Season(p-~begin(seasons)); 
return true; 
} 


注意 ， 由 于 US_season io 只 是 Season_io 接口 的 一 个 实现 ,我 没有 为 其 定义 id。 实际 上 ， 如 果 
希望 US_season_io 作为 一 个 Season_io 使 用 ,我 们 就 不 能 赋予 它 自己 独 有 的 id。 像 has_facet( 见 
39.3.1 节 ) 这 样 的 locale 操作 ， 都 依赖 于 “实现 相同 概念 的 facet 被 相同 的 id 所 标识 ”( 见 39.3 节 )。 

唯一 有 趣 的 实现 问题 是 : 如 果 被 要 求 输出 一 个 无 效 的 Season， 我 们 该 怎么 办 。 这 自然 
不 该 发 生 ， 但 对 某 个 简单 的 用 户 自 定义 类 型 找到 一 个 无 效 值 通 常 并 不 困难 ， 因 此 ， 将 此 情况 
纳入 考虑 是 很 有 实际 意义 的 。 对 此 ， 我 本 可 以 抛 出 一 个 异常 ， 但 当 处 理 供 人 类 阅读 的 简单 输 
出 时 ， 为 越界 的 值 生成 一 个 “越界 表示 ”通常 是 很 有 用 的 。 注 意 ， 对 输入 而 言 ， 错 误 处 理 策 
略 是 交 给 >> 运算 符 负 责 的 ， 而 对 输出 来 说 ，facet 的 函数 to_str() 负责 实现 错误 处 理 策略 。 
这 展示 了 不 同 的 设计 选择 ， 在 一 个 “产品 级 设计 ”中 ，facet 函数 或 者 同时 为 输入 和 输出 实 
现 错误 处 理 ， 或 者 仅仅 报告 错误 ， 由 >> 和 << 来 处 理 。 

Season_io 的 设计 依赖 派生 类 提供 locale 相关 的 字符 串 。 田 一 种 设计 方案 是 Season_ 
io 自己 从 一 个 locale 相关 的 仓库 中 提取 这 些 字符 串 〈( 见 39.4.7 节 )。 只 设计 单一 Season_io 
类 ， 将 季节 字符 串 作 为 构造 函数 实 参 的 方式 留 给 读者 作为 练习 。 


39.3.3 locale 和 facet 的 使 用 


locale 在 标准 库 中 的 主要 用 途 是 用 于 IO 流 。 但 locale 机 制 是 表示 文化 敏感 信息 的 一 种 
通用 且 可 扩展 的 机 制 。messages facet ( 见 39.4.7 节 ) 就 是 一 个 与 IO 流 完 全 无 关 的 facet 
的 例子 。 扩 展 到 iostream 库 甚至 不 基于 流 的 IO 特性 ， 可 发 挥 locale 的 优势 。 而 且 ， 用 户 
可 以 将 locale 作为 组 织 任意 文化 敏感 信息 的 方便 手段 。 

由 于 locale/facet 机 制 的 通用 性 ， 用 户 自 定义 facet 是 没有 限制 的 。 可 能 的 facet 候选 
包括 日 期 、 时 区 、 电 话 号 码 、 社 会 保险 号 码 (个 人 身份 号 码 )、 产 品 编码 、 温 度 、 通 用 的 ( 单 
位 ,， 值 ) 对 、 邮 政 编码 、 衣 服 尺寸 以 及 ISBN 号 码 。 

类 似 其 他 任何 一 种 强大 的 机 制 ，facet 必须 小 心 使 用 。 可 以 用 一 个 facet 表达 并 不 意味 
着 这 就 是 最 好 的 表示 方式 。 与 往常 一 样 ， 选 择 一 种 文化 差异 的 表示 方式 时 需 考虑 的 关键 问题 
是 不 同 决策 如 何 影响 编码 难度 、 代 码 的 易 读 性 、 程 序 的 可 维护 性 以 及 LO 操作 的 时 空 效 率 。 


39.4 标准 facet 
在 <locale> 中 ， 标准 库 提供 了 以 下 facet: 


标准 facet (iso.22.3.1.1.1 ) 











collate 字符 串 比较 collate<C> 39.4.1 节 
numpunct<C> 
numeric 数值 格式 num_get<C,In> 39.4.2 节 


num_put<C,Out> 
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( 续 ) 
标准 facet (iso.22.3.1.1.1 ) 
moneypunct<C> 
iiondtdiy 货币 格式 moneypunct<C,International> 3943 节 


money_get<C,In> 
money_put<C,Out> 





time_put<C,Out> 
time 日 期 和 时 间 格 式 time_put_byname<C,Out> 39.4.4 节 
time_get<C,In> 





ctype<C> 
ctype 字符 分 类 codecvt<ln,Ex,SS> 39.4.5 节 
codecvt _byname<ln,Ex,SS> 








messages 消息 提取 messages<C> 39.4.7 节 


细节 将 在 参考 章节 中 介绍 。 

当 实 例 化 上 表 列 出 的 facet 时 ，C 必须 是 一 个 字符 类 型 ( 见 36.1 节 )。 标 准 库 已 为 char 
和 w_char 定 义 了 这 些 facet。 此 外 ，ctype<C> 还 保证 支持 char16 t 和 char32_t。 如 果 
用 户 需 要 使 用 标准 IO 处 理 其 他 字符 类 型 X， 就 必须 依赖 具体 C++ 实现 特有 的 facet 特例 
化 版 本 或 自己 提供 适合 X 的 facet 版 本 。 例 如 ， 为 了 控制 X 和 char 之 间 的 转换 ， 可 能 需要 
codecvt<X,char,mbstate_t> ( 见 39.4.6 节 )。 

International 可 能 为 true 或 false ; true 表示 使 用 三 字符 (再 加 上 结尾 符 0 ) 的 “国际 ” 
货币 符号 表示 ( 见 39.4.3.1 节 )， 例 如 USD 和 BRL。 

移 位 状态 参数 SS 用 来 表示 多 字 节 字符 表示 中 的 移 位 状态 ( 见 39.4.6 节 )。 在 <cwchar> 
中 定义 了 mbstate_t， 表 示 可 能 发 生 在 具体 C++ 实现 定义 的 多 字 节 字符 编码 规则 集合 中 的 
任何 转换 状态 。 对 任意 字符 类 型 X， 与 mbstate_t 对 应 的 是 char_traits<X>::state_type ( 见 
36.22 节 i 

In 和 Out 分 别 是 输入 迭代 右 和 输出 迭代 器 ( 见 33.1.2 节 和 33.1.4 节 )。 给 定 带 这 些 模 
板 参 数 的 _put 和 _get， 就 允许 程序 员 提 供 访 问 非 标 准 库 缓冲 区 的 facet ( 见 39.4.2.2 节 )。 
与 iostream 关联 的 缓冲 区 是 流 缓 冲 区 ， 因 此 为 其 提供 的 迭代 器 是 ostreambuf iterator ( 见 
38.6.3 节 和 39.4.2.2 节 )。 从 而 ， 函 数 failed() 可 用 于 错误 处 理 ( 见 38.6.3 节 )。 

每 个 标准 facet 都 有 一 个 _byname 版 本 ，facet F_byname 派生 自 facet F。F_byname 
提供 了 与 F 一 样 的 接口 ， 只 是 增加 了 一 个 构造 函数 ， 接 受 表示 locale 名 的 字符 串 参数 (如 ， 
参考 39.4.1 节 )。F_byname(name) 为 定义 于 locale(name) 中 的 F 提供 了 恰当 的 语义 。 例 如 : 


sort(v.begin(),v.end(),collate_byname{"da_ DK"™}); // sortusing character comparison from "da DK" 


基本 设计 思路 是 从 程序 执行 环境 中 的 命名 locale ( 见 39.2.1 节 ) 提取 一 个 标准 facet 版 
本 。 这 意味 着 _byname 构造 函数 与 不 需要 询问 执行 环境 的 构造 函数 相 比 可 能 慢 得 多 。 与 在 
程序 中 很 多 位 置 使 用 _byname facet 相 比 ， 构 造 一 个 locale 然后 访问 其 facet 几乎 总 是 要 更 
快 。 因 此 ， 从 执行 环境 读 取 一 个 facet， 然 后 反复 使 用 它 在 主 存 中 的 拷贝 ， 通常 是 一 个 好 主 
意 。 例 如 : 
locale dk {"da_DK")}; 咱 读 取 丹麦 语 locale (包括 其 facet) 一 次 ， 
// 然后 按 需 使 用 它们 


void f(vector<string>& v const locale& loc) 
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{ 
const collate<char>& col {use_facet<collate<char>>(dk)}; 
const ctype<char>& ctyp {use_facet<ctype<char>>(dk)}; 
locale dk1 {loc,&col}; 儿 使 用 丹麦 语 字符 串 比 较 
locale dk2 {dk1,&ctyp}; /使 用 丹麦 语 字符 分 类 和 字符 串 比 较 
sort(v.begin(),v.end(),dk2); 
全 

} 


本 例 中 的 dk2 区 域 设置 将 使 用 丹麦 语 风格 的 字符 串 但 保留 默认 的 数值 表示 规范 。 

类 别 的 概念 提供 了 一 种 操纵 locale 中 标准 facet 的 更 简单 的 方法 。 例 如 ， 给 定 dk 区 域 
设置 ， 我们 可 以 构造 一 个 locale， 按 丹麦 语 规则 读 取 和 比较 字符 串 〈 比 英语 多 三 个 元 音 )， 但 
保留 C++ 中 的 数值 表示 : 


locale dk_us(locale::classic(),dk,collatelctype); 。 // 丹 麦 字母 ， 美 国 数值 


接 下 来 逐个 介绍 标准 facet 时 会 有 更 多 facet 使 用 的 例子 。 特 别 是 ，collate 的 讨论 ( 见 
39.4.1 节 ) 展示 了 很 多 facet 的 共同 结构 特征 。 

标准 facet 通常 相互 依赖 。 例 如 ，num_put 依赖 numpunct。 只 有 在 了 解 了 每 个 facet 
的 细节 后 ， 你 才 可 能 成 功 地 混合 使 用 并 匹配 facet 或 是 为 标准 facet 添加 新 版 本 。 换 言 之 ， 
除了 一 些 简单 操作 (如 对 iostream 使 用 imbue() 以 及 对 sort() 使 用 collate)，locale 机 制 并 
不 适合 初学 者 直接 使 用 。 区 域 设置 更 详细 的 讨论 请 见 [Langer, 2000]。 

facet 的 设计 通常 很 麻烦 。 一 部 分 原因 是 facet 必须 反映 在 标准 库 设计 者 控制 之 外 的 复杂 
的 文化 习惯 ， 另 一 部 分 原因 是 C++ 标准 库 特性 必须 与 C 标准 库 和 不 同 的 平台 相关 标准 所 提 
供 的 特性 保持 最 大 程度 的 兼容 。 

另 一 方面 ,locale 和 facet 提供 的 框架 是 通用 且 灵 活 的 。facet 可 被 设计 为 保存 任何 数据 ， 
其 操作 可 提供 基于 这 些 数据 的 任何 需要 的 动作 。 如 果 一 个 新 facet 的 行为 并 未 被 文化 习惯 过 
分 限制 ， 则 其 设计 会 很 简单 、 很 清晰 ( 见 39.3.2 节 )。 


39.4.1 string 比较 
标准 collate facet 提供 了 比较 字符 数组 的 方法 : 


template<class C> 
class collate : public locale::facet { 
public: 

using char type = Ci; 

using string_type = basic_string<C>; 


explicit collate(size_t = 0); 


int compare(const C* b, const Cr e, const C* b2, const C* e2) const 
{return do_compare(b,e,b2,e2); } 


long hash(const C* b, const C* e) const 
{return do_hash(b,e); } 

string_type transform(const C* b, const C* e) const 
{return do_transform(b,e); } 


static locale::id id; /| facet 标识 符 对 象 ( 见 39.2 节 、39.3 节 和 39.3.1 节 ) 
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protected: 


“collate(); // 注意 ; 保护 的 析 构 函数 


virtual int do_compare(const C* b, const C* e, const Cx b2, const C* e2) const; 
virtual string_type do_transform(const Cr b, const C* e) const; 
virtual long do_hash(const C* b, const C* e) const; 
上 
这 段 代码 定义 了 两 个 接口 : 
e 为 facet 用 户 提供 的 public 接口 。 
。 为 facet 派生 类 实现 者 提供 的 protected 接口 。 
构造 函数 参数 指出 是 locale 还 是 用 户 负责 删除 facet。 默 认 值 (0) 表示 “由 locale 管理 ”( 见 
39.3 节 )。 


所 有 标准 库 facet 具有 共同 的 结构 ， 因 此 一 个 facet 的 重要 内 容 可 以 概括 为 如 下 关键 函数 : 


collate<C> facet (iso.22.4.4.1 ) 
int compare(const C* b, const C* e, const C* b2, const C* e2) const; 





long hash(const C* b, const C* e) const; 


string_type transform(const C* b, const C* e) const; 


为 了 定义 一 个 facet， 可 以 使 用 collate 作为 模式 。 为 了 从 一 个 标准 模式 派生 一 个 新 facet， 
可 以 简单 地 为 提供 facet 功能 的 关键 函数 定义 do_* 版 本 。 上 表 列 出 了 函数 的 完整 声明 (而 非 
使 用 方式 )， 这 为 编写 覆盖 版 本 的 do_* 函数 提供 了 足够 的 信息 。 具 体 示 例 请 见 39.4.1.1 节 。 
函数 hash() 为 输入 字符 串 计算 一 个 哈 希 值 。 显 然 ， 这 对 构造 哈 希 表 是 很 有 用 的 。 
函数 transform() 生成 一 个 字符 串 ， 当 与 另 一 个 transform() 过 的 字符 串 比 较 时 ， 得 到 与 
比较 原始 字符 串 相同 的 结果 。 即 : 


cf.compare(cf.transform(s),cf.transform(s2)) == cf.compare(s,s2) 


transform() 的 目的 是 允许 优化 一 个 字符 串 与 许多 其 他 字符 串 比 较 的 代码 。 当 实现 字符 串 集 
合 搜索 时 ， 这 个 函数 就 很 有 用 了 。 

滑 数 compare() 依据 为 特定 collate 定义 的 规则 执行 基本 的 字符 串 比 较 。 它 返回 : 

1 若 第 一 个 字符 串 在 字典 序 上 比 第 二 个 字符 串 更 大 

0 车 两 个 字符 串 相 等 

-1 若 第 二 个 字符 串 更 大 
例如 : 


void f(const string& s1, const string& s2, const collate<char>& cmp) 


{ 
const char: cs1 {s1.data()}; /| 因为 compare() 对 char[] 进行 操作 
const char: cs2 {s2.data()}; 


switch (cmp.compare(cs1,cs1+s1.size(),cs2,cs2+S2.size()){ 


case 0: 儿 根据 cmp 比较 结果 ， 两 个 字符 串 相 等 
及 
break 
case -1: lis1<s2 
1/ .. 
break; 


case 1: ls1>s2 
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break; 


collate 的 成 员 函 数 比 较 的 是 C 的 序列 [b:e)， 而 不 是 basic_string 或 者 零 结尾 的 C 风格 字符 
串 。 特 别 是 ,一 个 值 为 0 的 C 被 当 作 普通 字符 而 非 结 尾 符 来 处 理 。 

标准 库 string 不 是 locale 敏感 的 。 即 ， 它 依据 具体 C++ 实现 的 字符 集 的 规则 来 比较 字 
符 串 ( 见 6.2.3 节 )。 而 且 ， 标 准 string 不 提供 直接 指定 比较 标准 的 方法 ( 见 第 36 章 )。 为 了 
进行 locale 敏感 的 比较 ,我 们 可 以 使 用 coilate 的 compare()。 例 如 : 


void f(const string& s1, const string& s2, const string& name) 


{ 
bool b {s1==s2}; 儿 用 C++ 实现 的 字符 集 值 进行 比较 
const char* s1b {s1.data()}; 儿 获得 数据 的 起 始 位 置 
const char* s1e {s1.data()+s1.size()} /| 获得 数据 的 结束 位 置 
const char* s2b {s2.datal()}; 
const char* s2e {s2.data()+s2.size()} 
using Col = collate<char>; 
const Col& global {use facet<Col>(locale{})}; /来 自 当 前 全 局 locale 
int i0 {global.compare(s1b,s1e,s2b,s2e)}; 
const Col& my_coll fuse_facet<Col>(locale{”})}; /1 来 自我 优选 的 locale 
int i1 {my_coll.compare(s1b,sie,s2b,s2e)}; 
const Col& n_coll fuse_facet<Col>(localefnamej)}; 儿 来 自 一 个 命名 locale 
int i2 {n_coll.compare(s1b,s1e,s2b,s2e)}; 
， 


在 符号 表示 上 ， 通 过 locale 的 operator() ( 见 39.2.2 节 ) 间接 使 用 collate 的 compare() 可 
能 更 为 方便 。 例 如 : 


void f(const string& s1, const string& s2, const string& name) 


{ 
int i0 = locale{}(s1,s2); 咱 使 用 当前 全 局 locale 进行 比较 
int i1 = locale{""}(s1,s2); 川 使 用 我 优选 的 locale 进行 比较 
int i2 = localeftname}(s1,s2);”// 使 用 命名 locale 进行 比较 
Wkss 

} 


不 难 想象 i0、i1 和 讼 不同 的 情况 。 考 虑 下 面 来 自 德 文字 典 的 单词 序列 : 
Dialekt, Diat, dich, dichten, Dichtung 
根据 德 文 习 惯 , (只有) 名 词 才 大 写 , 但 排序 是 大 小 写 不 敏感 的 。 
一 个 大 小 写 敏 感 的 德 文 排序 会 将 所 有 以 D 开头 的 单词 排 在 以 d 开头 的 单词 之 前 : 
Dialekt, Diat, Dichtung, dich, dichten 
这 里 的 二 (元 音 a 变 音 ) 被 当 作 “一 种 a” 来 处 理 ， 因 此 它 排 在 c 之 前 。 但 是 ， 在 大 多 
数字 符 集中 ，& 的 数值 比 c 更 大 。 因 此 ，int('e')<int( 癌 )， 基 于 数值 的 简单 默认 排序 会 得 到 : 


Dialekt, Dichtung, Diat, dich, dichten 


编写 一 个 比较 函数 ， 根 据 字典 进行 正确 排序 ， 是 一 个 有 趣 的 练习 。 
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39.4.1.1 命名 collate 
一 个 collate_byname 是 由 构造 函数 字符 串 实 参 命 名 的 locale 所 对 应 的 collate 版 本 : 
template<class C> 
class coliate_byname : public coliate<C>{ /注意 : 无 id， 无 新 函数 
public: 
typedef basic string<C> string_type; 


explicit collate_byname(const char*, size_tr=0); // 从 命名 locale 构造 
explicit collate_byname(const string&, size tr = 0); 

protected: 
“collate_byname(); // 注意: 保护 的 析 构 函数 


int do_compare(const Cr b, const C:* e, const C+ b2, const C: e2) const override; 
string_type do transform(const C:* b, const C* e) const override; 
long do_hash(const C* b, const Cr e) const override; 
}; 
因此 ，collate_byname 可 用 来 从 程序 执行 环境 的 命名 locale 中 提取 collate ( 见 39.4 节 )。 
在 执行 环境 中 保存 facet 的 一 个 显而易见 的 方法 是 将 其 保存 于 文件 中 。 男 一 种 不 太 灵 活 的 方 
法 是 用 程序 代码 或 _byname facet 中 的 数据 表示 facet。 


39.4.2 ”数值 格式 化 


数值 输出 是 通过 num_put facet 写 人 流 缓冲 区 ( 见 38.6 节 ) 实现 的 。 反 过 来 ， 数 值 输入 
是 通过 num_get facet 读 取 流 缓冲 区 实现 的 。num_put 和 num_get 使 用 的 格式 由 一 个 名 为 
numpunct 的 “数值 标点 ”facet 定义 。 
39.4.2.1 数值 标点 

numpunct facet 定义 了 内 置 类 型 的 IO 格式， 如 bool、int 和 double : 





numpunct<C> facet (iso.22.4.6.3.1 ) 








C decimal_point() const:; 如 

C thousands_sep() const; 如 

string grouping() const; 如 表示 “不 分 组 ” 
string_type truename() const; 如 'true' 
string_type falsename() const; 如 'false' 


grouping() 返回 的 字符 串 的 字符 应 理解 为 小 整数 值 的 序列 ， 其 中 每 个 小 整数 指出 一 个 分 
组 中 的 数字 个 数 。 字 符 0 指出 最 右 分 组 (最低 有 效 位 数字 )， 字 符 1 指出 左边 下 一 个 分 组 ， 
以 此 类 推 。 因 此 ，"004\002\003" 描 述 了 一 个 类 似 123-45-6789 形 式 的 数值 (假定 你 
用 '-' 作为 分 隔 符 )。 如 必要 ， 分 组 模式 中 最 后 一 个 数字 可 以 重复 使 用 ， 因 此 "003" 等 价 于 
"003\003\003"。 分 组 最 常见 的 用 途 是 令 大 数 更 易 读 。 函 数 grouping() 和 thousands_sep() 
定义 了 整数 和 浮 点 数 整数 部 分 的 输入 /输出 格式 。 

我 们 可 以 通过 派生 numpunct 来 定义 新 的 标点 风格 。 例 如 ， 我 可 以 定义 一 个 My_punct 
facet， 在 输出 整数 时 用 空格 作为 分 组 (三 个 数字 一 组 ) 的 分 隔 符 ， 在 输出 浮 点 值 时 用 欧洲 风 
格 的 逗号 作为 “小 数 点 ”: 


class My_punct : public numpunct<char> { 
public: 
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explicit My_punct(size tr=0) :numpunct<char>(r) {} 


protected: 
char do_decimal point() const override {return ',;} /逗号 
char do_thousands_sep() const override { return : ';} 放下 划 线 
string do_grouping() const override { return "\003"; } /三 个 数字 一 个 分 组 
Eb 
void f() 
{ 


cout << "style A: " << 12345678 
<<"*+# "<< 1234567.8 
<<"#+*" << fixed << 1234567.8 << "\n’; 
cout << defaultfloat; 儿 重 设 浮 点 数 格 式 
locale loc(locale(),new My_punct); 
cout.imbue(loc); 
cout << “style B: " << 12345678 
<<”### "<< 1234567.8 
<< "+***" <<fixed << 1234567.8 << \n'; 





} 


这 段 代码 会 输出 : 

style A: 12345678 :xy 1.23457e+06 *s* 1234567.800000 

style B: 12 345 678 *** 1 234 567,800000 *** 1 234 567,800000 

主意 , imbue() 在 流 中 保存 了 其 实 参 的 一 个 副本 。 因 此 ， 即 使 locale 的 原始 拷贝 已 经 被 销毁 ， 

六 季 让 类 可 以 依赖 于 被 赋予 的 locale。 如 果 一 个 iostream 有 其 自己 的 boolalpha 标志 集 ( 见 
38.4.5.1 节 )， 则 truename() 和 falsename() 返回 的 字符 串 分 别 表示 true 和 false; 否则 使 用 
1 和 0。 

标准 库 也 提供 了 numpunct 的 _byname 版 本 ( 见 39.4 节 和 39.4.1 节 ): 


template<ciass C> 
class numpunct_ byname : public numpunct<C> { 
a 


上 
39.4.2.2 ”数值 输出 
当 写 入 流 缓 冲 区 ( 见 38.6 节 ) 时 ，ostream 依赖 于 num_put facet: 


num_put<C,Out=ostreambuf_iterator<C>> (iso.22.4.2.2 ) 
将 值 v 放置 于 流 s 中 的 位 置 b 
Out put(Out b, ios_base& s, C fill, bool v) const; 
Out put(Out b, ios_base& s, C fill, long v) const; 





Out put(Out b, ios_base& s, C fill, long long v) const; 

Out put(Out b, ios_base& s, C fill, unsigned long v) const; 

Out put(Out b, ios_base& s, C fill, unsigned long long v) const; 
Out put(Out b, ios_base& s, C fill, double v) const; 

Out put(Out b, ios_base& s, C fill, long double v) const; 

Out put(Out b, ios_base& s, C fill, const void* v) const; 


put() 返回 一 个 迭代 器 ， 指 向 最 后 一 个 输出 字符 之 后 的 位 置 。 
num_put 的 默认 特例 化 版 本 (用 来 访问 字符 的 迭代 侨 的 类 型 为 ostreambuf_iterator<C> 
的 那个 版 本 ) 是 标准 locale ( 见 39.4 节 ) 的 一 部 分 。 为 了 在 别处 使 用 num_put， 我 们 必须 定 


义 一 个 适合 的 特例 化 版 本 。 例 如 ， 下 面 是 一 个 非常 简单 的 写 人 string 的 num_put: 


template<class C> 
class String_numput : public num_put<C,typename basic string<C>::iterator> { 
public: 

String_numput() :num_put<C,typename basic string<C>::iterator>{1} { } 


》 
我 并 不 想 将 String_numput 放 入 locale， 因 此 使 用 构造 函数 的 实 参 保持 普通 的 生命 周期 规 
则 。 其 预期 用 法 像 下 面 这 样 : 


void flint i, string& s, int pos) // 格 式 化 i， 存 入 s 中 pos 开始 的 位 置 
{ 


String_numput<char>f; 
f.put(s.begin()+pos,cout,' ,i); /格式 化 1i， 存 入 s; 使 用 cout 的 格式 规则 
} 


ios_base 参数 (本 例 中 是 cout) 提供 了 格式 状态 和 locale 的 相关 信息 。 例 如 : 


void test(iostream& io) 


{ 
locale loc = io.getloc(); 
wchar t wc = use facet<ctype<char>>(loc).widen(c); /char 转换 为 C 
string s = use_facet<numpunct<char>>(loc).decimal_point(); // 默认 值 ”.…” 
string false_name = use_facet<numpunct<char>>(loc).falsename();  // 默认 值 "false" 
} 


我 们 通常 通过 标准 IO 流 函 数 来 隐 式 使 用 numpunct<char> 这 样 的 标准 facet。 因 此 ， 大 多 
数 程 序 员 不 必 了 解 facet 的 细节 。 但 是 ， 通 过 标准 库 函 数 使 用 这 些 facet 很 有 趣 ， 因 为 这 展 
示 了 JI/O 流 如 何 工 作 以 及 facet 如 何 使 用 。 一 如 以 往 ， 标 准 库 提供 了 一 些 实例 展示 有 趣 的 编 
程 技 术 。 

使 用 num_put，ostream 可 以 实现 如 下 : 


template<class C, class Tr> 
basic_ostream<C,Tr>& basic ostream<C,Tr>::operator<<{double d) 


{ 
sentry guard(*this); 儿 见 38.4.1 节 
if (iguard) return *this; 
try{ 
if (use_ facet<num_put<C,Tr>>(getloc()).put(*this, :this,this—>fill(),d).failed()) 
setstate(badbit); 
} 
catch (...) { 
handle_ioexception(*this); 
} 
return *this; 
} 


这 段 代 码 有 很 多 地 方 值得 一 提 。 哨 兵 被 用 来 确保 所 有 前 级 和 后 级 操作 都 能 执行 ( 见 38.4.1 
节 )。 我 们 通过 调用 ostream 的 成 员 函 数 getloc() 来 获得 其 locale ( 见 38.4.5.1 节 )。 我 们 用 
use _facet 从 这 个 locale 提取 num_put ( 见 39.3.1 节 )。 然 后 ,我 们 调用 恰当 的 put() 来 做 真 
正 的 工作 。 我 们 可 以 从 一 个 ostream 构造 一 个 ostreambuf iterator ( 见 38.6.3 节 )， 也 可 以 
将 一 个 ostream 隐 式 转换 为 其 基 类 ios_base ( 见 38.4.4 节 )， 因 此 提供 put() 的 前 两 个 参数 
很 简单 。 
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调用 put() 会 返回 其 输出 迭代 器 参数 。 此 输出 迭代 器 是 从 basic_ostream 获得 的 ， 因 
此 是 一 个 ostreambuf_iterator。 这 样 ， 我 们 就 可 以 用 failed() ( 见 38.6.3 节 ) 测试 IO 失败 ， 
还 可 以 恰当 设置 流 的 状态 。 

我 并 未 使 用 has_facet， 因 为 每 个 locale 都 保证 具有 标准 facet ( 见 39.4 节 )。 如 果 该 保 
证 被 违反 ， 会 抛 出 一 个 bad_cast 异常 ( 见 39.3.1 节 )。 

函数 put() 会 调用 虚 函 数 do_put()。 因 此 ， 过 程 中 可 能 会 执行 用 户 自 定义 代码 ， 
operator<<() 必须 准备 好 处 理 覆 盖 版 本 的 do_put() 抛 出 的 异常 。 而 且 ， 某 些 字符 类 型 可 能 
没有 num_put， 因 此 use_facet() 可 能 抛 出 bad_cast ( 见 39.3.1 节 )。 内 置 类 型 如 double 
上 的 << 的 行为 是 由 C++ 标准 定义 的 。 因 此 ， 问 题 不 在 于 handle_ioexception() 应 该 做 什 
么 ， 而 是 它 应 该 如 何 完成 C++ 标准 所 规定 的 操作 。 如 果 此 ostream 的 异常 状态 中 的 badbit 
已 置 位 ( 见 38.3 )， 则 简单 重 抛 册 异常。 否则， 异常 处 理 的 方式 是 设置 流 状态 ， 继 续 执 行程 
序 。 在 任何 一 种 情况 下 ， 都 必须 置 位 流 状态 中 的 badbit ( 见 38.4.5.1 节 ): 


template<class C, class Tr> 
void handle_ioexception(basic_ostream<C,Tr>& s)// 从 catch 子 句 调用 


{ 
it (s.exceptions()&ios base::badbit) { 
try{ 
s.setstate(ios_base::badbit); // 可 能 抛 出 basic ios::failure 


} 
catch(...) { 


ll... do nothing ... 
} 
throw; ”W/ 重 抛 出 


s.setstate(lios_base::badbit); 


} 
try 块 是 必需 的 ， 因 为 setstate() 可 能 抛 出 basic_ios::failure ( 见 38.3 节 和 38.4.5.1 节 )。 但 
是 ， 如 果 异 常 状 态 中 的 badbit 已 置 位 ，operator<<() 必须 重 抛 出 导致 handle_ioexception() 
被 调用 的 那个 异常 〈 而 不 是 简单 抛 出 basic_ios::failure ) 。 

针对 内 置 类 型 如 double 的 << 操作 必须 实现 为 直接 写 人 流 缓 冲 区 。 而 当 为 用 户 自 定义 
类 型 编写 << 时 ， 我 们 通常 可 以 通过 将 其 输出 表达 为 已 有 类 型 的 输出 来 避免 这 种 编码 复杂 性 
( 见 39.3.2 节 )。 
39.4.2.3 ”数值 输入 

当 从 流 缓冲 区 ( 见 38.6 节 ) 读 取 数据 时 ，istream 依赖 于 num_get facet: 


num_get<In = istreambuf_iterator<C>> facet (iso.22.4.2.1 ) 
读 取 [b:e) 存 人 v， 使 用 来 自 s 的 格式 化 规则 ， 通 过 设置 报告 错误 


In get(In b, In e, ios_base& s, ios_base::iostate& r, bool& v) const; 








In get(In b, In e, ios_base& s, ios_base::iostate& r, long& v) const; 

In get(In b, In e, ios_base& s, ios_base::iostate& r, long long& v) const; 

In get(In b, In e, ios_base& s, ios_base::iostate& r, unsigned short& v) const; 

In get(In b, In e, ios_base& s, ios_base::iostate& rn unsigned int& v) const; 

In get(In b, In e, ios_base& s, ios_base::iostate& r, unsigned long& v) const; 

In get(In b, In e, ios_base& s, ios_base::iostate& r, unsigned long long& v) const; 


In get(In b, In e, ios_base& s, ios_base::iostate& r, float& v) const; 
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num_get<ln = istreambuf _iterator<C>> facet (iso.22.4.2.1 ) 
读 取 [b:e) 存 人 v， 使 用 来 自 s 的 格式 化 规则 ， 通 过 设置 r 报告 错误 
In get(In b, In e, ios_base& s, ios_base::iostate& r, double& v) const; 
In get(In b, In e, ios_base& s, ios_base::iostate& r, long double& v) const; 
In get(In b, In e, ios_base& s, ios_base::iostate& r, void*& v) const; 


基本 上 ，num_get 的 组 织 与 num_put 相似 ( 见 39.4.2.2 节 )。 由 于 它 进行 读 取 而 非 写 人 ， 因 
此 get() 需要 一 对 输入 迭代 器 ， 而 且 指 出 读 取 源 的 参数 必须 是 一 个 引用 。 

num_get 会 设置 iostate 变量 r 来 反映 流 状 态 。 如 果 未 能 读 取 要 求 的 类 型 ，r 中 的 failbit 
被 置 位 ; 如 果 到 达 输 入 尾 ,r 中 的 eofbit 被 置 位 。 输 入 迭代 器 会 利用 r 确定 如 何 设置 流 状 态 。 
如 果 未 遇 到 错误 ， 则 将 读 取 的 值 赋予 v; 否则 v 保持 不 变 。 

哨兵 被 用 来 保证 流 的 前 级 和 后 级 操作 被 执行 ( 见 38.4.1 节 )， 特 别 是 保证 仅 在 流 处 于 和 良 
好 状态 时 才 进 行 读 取 。 例 如 ，istream 的 实现 者 可 编写 代码 如 下 : 


template<class C, class Tr> 
basic_istream<C,Tr>& basic_istream<C,Tr>::operator>>(double& d) 


{ 
sentry guard(*this); 咱 见 38.4.1 节 
if (!guard) return *this; 
iostate state = 0; /状态 良好 
istreambuf iterator<C,Tr> eos; 
try{ 
double dd; 
Use_facet<num_get<C,Tr>>(getioc()).get(*this,eos,*this,state,dd); 
if (state==0 || state==eofbit) d = dd; // 仅 当 get0 成 功 时 设置 值 
setstate(state); 
} 
catch (...) { 
handle_ioexception(*this); 。 // 见 39.4.2.2 节 
return *this; 
} 


我 小 心地 避免 修改 >> 的 目的 ， 除 非 读 操作 已 成 功 。 不 幸 的 是 ， 这 一 点 不 能 保证 对 所 有 输入 
操作 都 成 立 。 

若 发 生 错 误 ，istream 的 异常 机 制 会 启用 ， 由 setstate() 抛 出 异常 ( 见 38.3 节 )。 

通过 定义 一 个 numpunct， 例 如 39.4.2.1 节 中 的 My_punct， 我 们 就 可 以 使 用 非 标准 标点 读 
取 输 入 。 例 如 : 


void f() 
{ 
cout << "style A: " 
int i1; 
double d1; 
cin >> i1 >> d1; 儿 使 用 标准 ““12345678” ”格式 读 取 输入 


locale ioc(iocale::classic(),new My_punct); 
cin.imbue(loc); 

cout << "style B: " 

int i2; 

double d2; 





cin >> i >> d2; /使 用 ““12 345 678”” 格式 读 取 输 入 
} 


如 果 我 们 希望 以 很 不 寻常 的 格式 读 取 数值 ， 就 必须 覆盖 do_get()。 例 如 ， 我 们 可 以 定义 一 
读 取 XXI 和 MM 这 样 的 罗马 数字 的 num_get。 


39.4.3 ”货币 格式 化 


货币 金额 的 格式 化 在 技术 上 与 “普通 ”数值 的 格式 化 ( 见 39.4.2 节 ) 类 似 ， 但 货币 金额 
的 程序 受 文化 差异 的 影响 更 多 。 例 如 ， 在 某 些 场景 中 ， 负 的 金额 (亏损 、 借 蒜 )， 如 -1.25， 
要 表示 为 括号 中 的 整数 : (1.25)。 类 似 地 ， 在 某 些 场景 中 会 使 用 不 同 的 颜色 来 方便 识别 负 的 
金额 。 
并 不 存在 标准 的 “货币 类 型 ”，C++ 货币 facet 的 用 法 是 显 式 用 于 数值 类 型 (程序 员 已 
知 其 货币 金额 表示 方式 )。 例 如 : 


struct Money { 咱 保存 货币 金额 的 简单 类 型 
using Value = long long; /1 用 于 遭受 了 通货 膨胀 的 货 


Value amount; 


}; 
Wh 
void f(long int i) 


{ 


cout << "value=" <<i<<"amount=" << Money{i} << "\n’; 


} 
货币 facet 的 目标 是 令 编 写 Money 的 输出 运算 符 的 工作 变 得 非常 简单 ， 能 按照 区 域 习惯 打 
证 多 ( 见 39.4.3.2 节 )。 输 出 可 能 依赖 cout 的 locale 而 变化 。 本 例 的 输出 可 能 是 : 


value= 1234567 amount= $12345.67 
value= 1234567 amount= 12345,67 DKK 
value= 1234567 amount= CAD 12345,67 
value= -1234567 amount= $-12345.67 
value= -1234567 amount= ~-€12345.67 
value= -1234567 amount= (CHF12345,67) 


对 货币 而 言 ， ee 因此 ， 我 采用 了 常用 规范 ， 用 整数 值 
表示 分 (便士 、 欧 尔 、 费 尔 、 美 分 等 )。moneypunct 的 frac_digits() 函数 支持 这 文 种 现 范 ( 见 
39.4.3.1 节 )。 类 似 地 ,“ 小 数 点 ”的 呈现 形式 由 decimal_point() 定义 。 

facet money_base 定义 了 货币 IO 格式 ，money_get 和 money_put 提供 了 根据 这 些 格 
式 进行 货币 IO 的 函数 。 

一 个 简单 的 Money 类 型 可 用 来 控制 IO 格式 或 保存 货币 值 。 在 前 一 种 情况 中 ， 我 们 

在 输出 之 前 将 保存 货币 金额 的 (其他) 类 型 的 值 转换 为 Money 类 型 ， 在 读 取 货币 值 存 人 
Money 变量 后 可 将 它们 转换 为 其 他 类 型 。 一 直 将 货币 金额 保存 在 Money 类 型 中 不 易 出 错 ; 
这 样 在 输出 之 前 我 们 不 会 忘记 将 值 转换 为 Money， 也 不 会 由 于 试图 以 locale 不 敏感 的 方式 
读 取 货币 值 而 出 错 。 但 是 ， 如 果 系 统 设计 中 并 未 考虑 这 方面 因素 ， 引 入 Money 类 型 有 可 能 
不 可 行 。 在 此 情况 下 ， 对 输入 输出 操作 应 用 Money 转换 就 是 必要 的 了 。 
39.4.3.1 ”货币 标点 

控制 货币 金额 表示 形式 的 facet， 即 moneypunct， 很 自然 地 类 似 控 制 普通 数值 的 facet 
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numpunct ( 见 39.4.2.1 节 ); 
class money_base { 
public: 
enum part{ 


none, space, Symbol, sign, value 


}; 


struct pattern { 
char field[4]; 
}; 
}; 


template<class C, booi International = false> 


儿 /部 分 数值 布局 


class moneypunct : public locale::facet, public money_base { 


public: 
using char type = C; 


using string_type = basic_string<C>; 


/本 
}; 


成 员 函 数 moneypunct 定义 了 货币 输入 输出 的 布局 : 


moneypunct<C,International>> facet (iso.22.4.6.3 ) 


C decimal_point() const; 

C thousands_sep() const; 

string grouping() const; 
string_type curr_symbol() const; 
string_type positive_sign() const; 
string_type negative_sign() const; 
int frac_digits() const; 

pattern pos_format() const; 


pattern neg_format() const; 





static const bool intl = International; 





如 

1 

如 表示 “不 分 组 ” 

如 '$' 

Wl 

如 "~" 

"后 数字 个 数 如 2 
symbol、space、sign、none 或 value 
symbol、space、sign 、none 或 value 
使 用 三 字母 国际 标准 缩写 


moneypunct 主要 供 facet money_put 和 money_get ( 见 39.4.3.2 节 和 39.4.3.3 节 ) 的 实现 


者 所 用 


标准 库 也 提供 了 moneypunct 的 _byname 版 本 ( 见 39.4 节 和 39.4.1 节 ): 


template<class C, bool Intl = false> 


class moneypunct_byname : public moneypunct<C, Intl>{ 


J 
}; 


成 员 decimal_point()、thousands_sep() 和 grouping() 与 numpunct 中 的 对 应 函数 类 似 。 

成 员 curr_symbol()、positive_sign() 和 negative_sign() 都 返回 字符 串 ， 分 别 表示 货币 
符号 (如 $$、 单 、INR、DKK)、 加 号 和 减 号 。 如 果 模 板 参 数 International 为 true， 则 intl 也 
为 true， 而 “international ”表示 要 使 用 的 货币 符号 。 这 种 “国际 ”表示 是 一 个 四 字符 的 C 


风格 字符 串 。 例 如 


"USD" 
"DKK™” 
"EUR" 
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最 后 一 个 (不 可 见 的 ) 字符 是 结尾 零 。 三 字母 的 货币 标识 是 由 ISO-4217 标准 定义 的 。 当 
International 为 false 时 ,使 用 “本 地 ”货币 符号 ,例如 $、£ 和 半 。 

pos_format() 或 neg_format() 返回 的 pattern 由 四 部 分 构成 ,定义 了 序列 中 数值 、 货 
币 符号 、 正 负 号 和 空白 符 的 布局 。 大 多 数 常 用 格式 简单 地 用 这 种 模式 概念 表示 。 例 如 : 


+$ 123.45 ll { sign, symbol, space, value }, positive_sign() 会 返回 "+" 
$+123.45 ll { symbol, sign, value, none }, positive_sign() 会 返回 "+" 
$123.45 ll { symbol, sign, value, none }, positive_sign() 会 返回 "" 
$123.45- I { symbol, value, sign, none } 

-123.45 DKK //{ sign, value, space, Symbol } 

($123.45) ll { sign, symbol, value, none }, negative_sign() 会 返回 "()" 


(123.45DKK) // { sign, value, symbol, none }, negative_sign() 会 返回 "0" 
令 negative_sign() 返回 一 个 包含 两 个 字符 () 的 字符 串 ， 即 可 实现 用 括号 表示 一 个 负数 。 正 
负 号 字符 串 的 第 一 个 字符 会 放 在 模式 中 sign 出 现 的 位 置 ， 而 剩余 字符 放 在 模式 所 有 其 他 这 
分 之 后 。 这 一 标准 库 特 性 最 常见 的 用 途 是 呈现 金融 界 习惯 的 负 金 额 的 括号 表示 ,但 也 可 用 于 
其 他 用 途 。 例 如 : 


-$123.45 I/ { sign, symbol, value, none }, negative_sign() 会 返回 "-" 
*$123.45 silly /I { sign, symbol, value, none }, negative_sign() 会 返回 "silly" 


sign、value 和 symbol 在 模式 中 只 能 出 现 一 次 ， 剩 下 的 一 个 值 可 以 是 space 或 none。 在 
space 出 现 的 位 置 ， 在 表示 形式 中 的 对 应 位 置 会 出 现 至 少 一 个 空白 符 ， 也 可 能 出 现 多 个 。 在 
none 出 现 的 位 置 ， 除 非 是 模式 尾 ， 否 则 在 表示 形式 中 会 出 现 零 个 或 多 个 空白 符 。 

注意 ， 这 些 严格 的 规则 会 禁止 一 些 显然 合理 的 模式 : 


pattern pat = { sign, value, none, none }; /| 错误 : 没有 货币 符号 symbol 


函数 frac_digits() 指出 decimal_point() 放置 在 哪里 。 通 常 ， 货 币 金额 表示 为 最 小 货币 单位 
( 见 39.4.3 节 )。 这 一 单位 一 般 是 主要 货币 单位 的 百 分 之 一 (例如 , & 是 $ 的 百 分 之 一 )， 因 此 
frac_digits() 通常 为 2。 

下 面 是 一 个 将 简单 的 格式 定义 为 facet 的 例子 : 

class My_money io : public moneypunct<chartrue> { 


public: 
explicit My_money _io(size tr=0):moneypunct<char,true>(r) {} 


char type do_decimal point() const { return '.; } 
char_type do_thousands sep() const { return ','; } 
string do_grouping() const { return "\003\003\003"; } 


string_type do_curr_symbol() const { return "USD "; } 
string_type do_positive_sign() const { return "™; } 
string_type do_negative_sign() const { return "()"; } 


int do_frac_digits() const { return 2;》 WW/ 小数 点 后 两 位 数字 


pattern do_pos_format() const { return pat; } 

pattern do_neg_format() const { return pat; } 
private: 

static const pattern pat; 


} 


const pattern My_money io::pat { sign, symbol, value, none }; 
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39.4.3.2 ”货币 输出 
facet money_put 根据 moneypunct 指定 的 格式 输出 货币 金额 。 具 体 来 说 ，money_put 
提供 了 put() 函数 ， 将 恰当 格式 化 后 的 字符 表示 放 人 和 人流 的 缓冲 区 中 : 


money_put<C,Out = ostreambuf iterator<C>> facet (iso.22.4.6.2 ) 
将 值 v 放 入 缓冲 区 中 位 置 b 处 
Out put(Out b, bool intl, ios_base& s, C fill, long double v) const; 
Out put(Out b, bool intl, ios_base& s, C fill, const string_type& v) const 





intl 参数 指出 是 使 用 标准 的 四 字符 “国际 ”货币 符号 还 是 “本 地 ”货币 符号 ( 见 39.4.3.1 节 )。 
给 定 money_put， 我 们 就 可 以 为 Money 定义 一 个 输出 运算 符 了 ( 见 39.4.3 节 ): 


ostream& operator<<(ostream& s, Money m) 


{ 


ostream::sentry guard(s); 咱 见 38.4.1 节 
if (1guard) return s; 


try { 
const money_ put<char>& f= use facet<money put<char>>(s.getloc!()); 


if (m==static_cast<long long>(m)) { //m 可 以 表示 为 一 个 long long 
if (f.put(s,true,s,s.fill(),m).failed()) 
s.setstate(ios_base::badbit); 


} 
else{ 
ostringstream v; 
vV<<m; 儿 转 换 为 字符 串 表 示 
if (f.put(s,true,s,s.fill(),v.str()).failed()) 
s.setstate(ios_ base::badbit); 


} 


} 
catch (...) { 
handile ioexception(s);”// 见 39.4.2.2 节 


} 


return s; 


} 
如 果 一 个 long long 的 精度 不 足以 精确 表示 货币 值 ， 我 将 值 转换 为 字符 串 表 示 并 用 接受 
string 参数 的 put() 输出 它 。 
39.4.3.3 ”货币 输入 

facet money_get 根据 moneypunct 指定 的 格式 读 取 货币 金额 。 具 体 来 说 ，money_get 
提供 了 get() 函数 ， 从 流 的 缓冲 区 中 提取 恰当 格式 化 的 字符 表示 : 


money_get<C,In = istreambuf iterator<C>> facet (iso.22.4.6.1 ) 

读 取 [b:e) 存 人 v， 使 用 来 自 s 的 格式 化 规则 ， 通 过 设置 报告 错误 
In get(In b, In e, bool intl, ios_base& s, ios_base::iostate& n long double& v) const'; 
In get(In b, In e, bool intl, ios_base& s, ios_base::iostate& r, string_type& v) const; 


一 对 定义 良好 Ne 和 money_put facet 会 保证 : 货币 的 输出 格式 在 读 回 时 不 会 产 
生 错 误 或 信息 ,已 \ 例 如 : 


int main() 


{ 
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Money mi; 
while (cin>>m) 
cout << m << \n", 
} 
这 个 简单 程序 的 输出 如 果 提 供给 自身 作为 输入 的 话 ， 也 是 会 被 接受 的 。 而 且 ， 如 果 以 程序 第 
一 次 运行 的 输出 作为 输入 再 次 运行 程序 ， 得 到 的 结果 与 第 一 次 的 结果 (也 是 第 二 次 的 输入 ) 
是 相同 的 。 
一 个 可 行 的 Money 输入 运算 符 可 能 像 下 面 这 样 : 


istream& operator>>(istream& s, Money& m) 


{ 
istream::sentry guard(s); 儿 见 io.sentry_ 
if (guard) try { 
ios_base::iostate state =0;  //good 
istreambuf iterator<char> eos; 
string str; 
use facet<money get<char>>(s.getloc()).get(s,eos,true, state,str); 
if (state==0 || state==ios_base::eofbit) { // 仅 当 getO 成 功 时 才 保 存 值 
long long i = stoll(str); / 儿 见 36.3.5 节 
if (errno==ERANGE) { 
state |= ios_base::failbit; 
} 
else{ 
m=i; / 仅 当 能 成 功 转换 为 l1ong long 时 才 保 存 值 
s.setstate(state); 
} 
} 
catch (...) { 
handle_ioexception(s);”// 见 39.4.2.2 节 
} 
return s; 
} 
我 使 用 get() 读 取 数据 存 人 一 个 string 中 ， 因 为 如 果 读 取 数 据 存 人 一 个 double 然后 再 将 其 


转换 为 一 个 long long， 可 能 会 导致 精度 损失 。 
能 用 long double 精确 表达 的 最 大 值 有 可 能 比 long long 能 精确 表达 的 最 大 值 小 。 


39.4.4 日 期 和 时 间 格 式 化 


日 期 和 时 间 的 格式 由 time_get<C,In> 和 time_put<C,Out> 控制 。 日 期 和 时 间 使 用 tm 
表示 ( 见 43.6 节 )。 
39.4.4.1 time_put 

facet time_put 接受 一 个 用 tm 表示 的 时 间 点 ， 用 strftime() ( 见 43.6 节 ) 或 等 价 函 数 生 
成 其 字符 序列 表示 。 


time_put<C,Out = ostreambuf iterator<C>> facet (iso.22.4.5.1 ) 
Out put(Out s, ios_base&f C fill, const tm* pt, const C* b, const C* e) const; 
Out put(Out s, ios_base& f, C fill, const tm* pt, char format, char mod = 0) consti 
Out do_put(Out s, ios_base& ib, const tm* pt, char format, char mod) const; 
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调用 s=put(s,f,fill,pt,b,e) 会 将 [b:e) 拷贝 到 输出 流 s。 对 [b:e) 中 每 个 带 可 选修 饰 符 mod 的 
strftime() 格式 字符 x，put() 调用 do_put(s,ib,pt,x,mod)。 修 饰 符 的 可 能 值 为 0 (默认 值 ， 本 
天 “无 " )、E 或 O。 覆 盖 版 本 的 p=do_put(s,ib,pt,x,mod) 应 该 格式 化 *pt 中 的 恰当 部 分 ， 
并 返回 一 个 值 指向 s 中 最 后 一 人 i 
标准 库 也 提供 了 messages 的 _byname 版 本 ( 见 39.4 节 和 39.4.1 节 )。 


template<class C, class Out = ostreambuf iterator<C>> 
class time_put_byname : public time_put<C,Out> 


{ 
ts 


} 
39.4.4.2 time_get 

基本 思想 是 ， 对 time_put 生成 的 内 容 ，time_get 可 用 相同 的 strftime() 格式 ( 见 43.6 
节 ) 读 取 。 


class time_ base{ 
public: 
enum dateorder { 
no_order, // 表 示 mdy (月 天 年 ) 


dmy, 儿 表 示 "%d%m%y" 
mdy, 儿 表示 "9%m%%d%y" 
ymd， /表示 "%y%m%d" 
ydm 儿 表 示 "%y%d%m" 


» 


template<class C, class In = istreambuf iterator<C>> 
class time_get : public locale::facet, public time_base { 
pubilic: 

using char type = C; 

using iter_type = 

Ms 
} 


除了 依据 格式 进行 读 取 外 ，time_get 还 提供 了 读 取 日 期 和 时 间 表示 中 特定 部 分 的 操作 : 


time_get<C,In> facet (iso.22.4.5.1 ) 
读 取 [b:e) 存 人 *pt 





dateorder date_order() const; 





In get_time(in b, In e, ios_base& ib, ios_base::iostate& err, tm* pt) const; 

In get_date(ln b, In e, ios_base& ib, ios_base::iostate& err, tm* pt) const; 

In get_weekday(In b, In e, ios_base& ib, ios_base::iostate& err, tm* pt) const; 

In get_monthname(In b, In e, ios_base& ib, ios_base::iostate& err, tm* pt) const; 

In get_yearl(In b, In e, ios_base& ib, ios_base::iostate& err, tm* pt) const; 

In get(In b, In e, ios_base& ib, ios_base::iostate& err, tm* pt, char format, char mod) const; 
In get(In b, In e, ios_base& ib, ios_base::iostate& err, tm* pt, char format) const; 


In get(In b, In e, ios_base& ib, ios_base::iostate& err tm* pt C* fmtb, C* fmte) const; 


函数 get_*() 从 [b:e) 读 取 日 期 /时 间 存 入 *pt， 从 b 获取 其 locale， 若 发 生 错 误 设 置 err。 它 
返回 一 个 迭代 器 ， 指 向 [b:e) 中 第 一 个 尚未 读 取 的 字符 的 位 置 。 
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调用 p=get(b,e,ib,err,pt,format,mod) 按 格 式 字 符 format 和 修饰 符 mod 指出 的 方式 读 
取 日 期 /时间 ， 格 式 符 合 修饰 符 如 strftime() 所 指定 。 若 未 指定 mod， 则 使 用 mod==0。 

调用 get(b,e,ib,err ptfmtb,fmte) 使 用 字符 串 [fmtb:fmte) 所 描述 的 格式 。 这 个 重 载 版 
本 与 使 用 默认 修饰 符 的 版 本 都 没有 do_get() 接口 ， 而 是 通过 调用 第 一 个 版 本 的 get() 的 do_ 
get() 实现 的 。 

时 间 和 日 期 facet 的 一 个 明显 用 途 是 为 Date 类 提供 一 个 locale 敏感 的 IO。 考虑 16.3 
节 中 Date 的 一 个 变 体 : 


class Date { 

public: 
explicit Date(int d ={}, Month m = 人 ,int year ={}); 
a 
string to_string(const iocale& = locale()) const; 


}; 


istream& operator>>(istream& is, Date& d); 
ostream& operator<<(ostream& os, Date d); 


使 用 stringstream ，Date::to_string() 产生 一 个 locale() 指定 的 string : 


string Date::to_string(const locale& loc) const 


{ 
ostringstream os; 
os.imbuel(loc); 
return os << *this; 
} 


给 定 to_string()， 输 出 运算 符 很 普通 : 


ostream& operator<<(ostream& os, Date d) 


{ 
return os<<to_string(d,os.getloc()); 
} 


istream& operator>>(istream& is, Date& d) 


if (istream::sentry guard{is}) { 
ios_base::iostate err = goodbit; 
struct tm t; 
use_facet<time_get<char>>(is.getloc()).get_date(is,0,is,err,&t); 。 // 读 取 日 期 存 入 t 
if (lerr) { 
Month m = static_cast<Month>(t.tm_mon+1); 
d= Date(t.tm_day,m,t.tm_year+1900); 


is.setstate(err); 


} 


return is; 


} 
+1900 是 必要 的 ， 因 为 用 tm 表示 日 期 的 元 年 是 1900 年 ( 见 43.6 节 )。 
标准 库 也 提供 了 messages 的 _byname 版 本 ( 见 39.4 节 和 39.4.1 节 )。 


template<class C, class In = istreambuf iterator<C>> 

class time_get_byname : public time_get<C, In> { 
Wh 

}; 
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39.4.5 字符 分 类 


当 从 输入 读 取 字符 时 ， 通常 需要 将 它们 分 类 以 弄 清 读 取 的 是 什么 。 例 如 ， 为 了 读 取 一 个 
数字 ， 输 入 程序 需要 了 解 哪些 字符 是 数字 。 类 似 地 ，10.2.2 节 展 示 了 如 何 使 用 标准 字符 分 类 
函数 分 析 输 入 数据 。 

字符 的 分 类 自然 依赖 于 所 使 用 的 字符 集 。 因 此 ， 标 准 库 提 供 了 一 个 facet ctype 来 表示 
locale 中 的 字符 分 类 。 

字符 类 别 用 一 个 名 为 mask 的 枚 举 类 型 描述 : 


class ctype_base{ 





public: 
enum mask { // 实际 值 由 具体 实现 定义 
space = 1, /空白 符 ("C" locale 中 的 '”、”\n’、”\t’、...) 
print = 1<<1, 咱 可 打印 字符 
cntrl = 1<<2, // 控制 字符 
upper = 1<<3, 儿 大 写字 母 
lower = 1<<4, /小 写字 母 
alpha = 1<<5， // 字母 
digit = 1<<6， // 十 进 制 数 字 
punct = 1<<7, 咱 标点 字符 
xdigit = 1<<8, | 十 六 进 制 数字 
blank = 1 << 9; 外 空格 和 水 平 制 表 符 
ainum=alphaldigit，// 字母 数 字 字符 
graph=alnum|punct 
}; 
上 


template<class C> 
class ctype : public locale::facet, public ctype_base{ 
public: 
using char type = C; 
UR 
}; 
此 mask 不 依赖 特定 字符 类 型 ， 因 此 将 其 枚 举 定 义 置 于 一 个 〈 非 模板 ) 基 类 中 。 
显然 ,mask 反映 了 传统 的 C 和 C++ 字符 分 类 ( 见 36.2.1 节 )。 但 是 ， 对 不 同 字符 集 ， 
不 同 字符 值 会 落 在 不 同 分 类 中 。 例 如 ， 对 ASCII 字符 集 ， 整 数值 125 表示 字符 }， 属 于 标点 
字符 ( punct)。 但是， 在 丹麦 国家 字符 集中 ，125 表示 元 音 a， 在 丹麦 语 locale 中 就 必须 归 
类 为 alpha。 
分 类 被 称 为 “ 掩 码 ”的 原因 是 : 为 高 效 实现 小 字符 集 的 字符 分 类 ， 传 统 上 使 用 一 个 表格 ， 
每 个 表 项 保存 表示 分 类 的 二 进 制 位 。 例 如 : 
table['P'] == upperlalpha 
table['a"] == lowerlalphalxdigit 
table[1] == digitlxdigit 
table{’ '] == spacelblank 
基于 这 种 实现 ， 若 字符 c 属于 类 别 m， 则 table[cJ&m 为 非 零 ， 和 否则 为 0。 
ctype facet 定义 如 下 : 


ctype<C> facet (iso.22.4.1.1 ) 
bool is(mask m, C c) const; 


const C* is(const C* b, const C* e, mask* v) const; 
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ctype<C> facet (iso.22.4.1.1 ) 
const C* scan_is(mask m, const C* b, const C* e) const; 
const C* scan_not(mask m, const C* b, const C* e) const; 
C toupper(C c) const; 
const C* toupper(C* b, const C* e) const; 
C tolower(C c) const; 
const C* tolower(C* b, const C* e) const; 
C widen(char c) const; 
const char* widen(const char* b, const char* e, C* b2) const; 
char narrow(C c, char def) const; 


const C* narrow(const C* b, const C* e, char def, char* b2) const; 


调用 is(m,c) 检测 字符 c 是 否 属于 类 别 m。 例 如 : 


int count_spaces(const string& s, const locale® loc) 


{ 
const ctype<char>& ct = use facet<ctype<char>>(loc); 
inti = 0; 
for(auto p = s.begin(); p!=s.end(); ++p) 
if (ct.is(ctype_base::space,*p)) 咱 是 否 ct 所 定义 的 空白 符 
十 十 ii 
return ji; 
} 


注意 ， 也 可 以 用 is() 检查 一 个 字符 是 否 属于 一 些 类 别 中 的 某 类 。 例 如 : 
ct.is(ctype_base::space|ctype_base::punct,c); lic 属于 et 所 定义 的 空白 符 或 标点 ? 


调用 is(b,e,v) 会 确定 [b:e) 中 每 个 字符 的 类 别 ， 并 将 结果 放置 在 数组 v 中 的 正确 位 置 。 

调用 scan_is(m,b,e) 会 返回 一 个 指针 ， 指 向 [b:e) 中 第 一 个 属于 类 别 m 的 字符 。 若 没 
有 字符 属于 类 别 m， 则 返回 e。 与 其 他 标准 facet 类 似 ， 会 有 成 员 函 数 实现 为 对 其 虚 函 数 
do_ 的 调用 。 一 个 简单 的 实现 如 下 所 示 : 

template<class C> 


const C* ctype<C>::do_scan_is(mask m, const C* b, const C* e) const 


while (bl=e && lis(m,*b)) 
++b; 
return b; 


} 
调用 scan_not(m,b,e) 会 返回 一 个 指针 ， 指 向 [b:e) 中 第 一 个 不 属于 类 别 m 的 字符 。 若 所 有 
字符 都 属于 类 别 m， 则 返回 e。 

如 果 所 使 用 的 字符 集中 存在 c 对 应 的 大 写字 母 ， 则 调用 toupper(c) 返回 此 大 写字 母 ， 
否则 返回 c。 

调用 toupper(b,e) 将 [b:e) 中 的 所 有 字符 都 转换 为 大 写 形式 ， 并 返回 e。 一 个 简单 的 实 
现 如 下 所 示 : 


template<class C> 
const C:* ctype<C>::to_upper(C+ b, const C* e) 


{ 
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for (; bi=e; ++b) 
*b = toupper(*b); 
return e; 


} 
函数 tolower() 与 toupper() 类 似 ， 只 是 转换 为 小 写 。 

调用 widen(c) 将 字符 c 转换 为 对 应 的 C 类 型 的 值 。 如 果 C 的 字符 集 提供 多 个 与 c 对 应 
的 字符 ，C++ 标准 指出 使 用 “最 简单 的 合理 转换 ”。 例 如 : 


wcout << use facet<ctype<wchar t>>(wcout.getloc()).widen('e"); 


会 输出 wcout 的 locale 中 与 字符 e 合理 对 应 的 字符 。 
无 关 字 符 表 示 (如 ASCII 和 EBCDIC) 间 的 转换 也 可 以 用 widen() 实现 。 例 如 ， 假 定 存 
在 ebcdic 区 域 设 置 : 


char EBCDIC_e = use facet<ctype<char>>(ebcdic).widen('e'); 


调用 widen(b,e,v) 会 逐个 处 理 [b:e) 中 的 每 个 字符 ,将 其 拓宽 版 本 放置 于 数组 v 中 的 对 应 
位 置 。 

调用 narrow(ch,def) 为 C 类 型 字符 ch 生成 对 应 的 char 值 。 同 样 ， 会 使 用 “最 简单 的 
合理 转换 ”。 如 果 不 存在 对 应 的 char， 则 返回 def。 

调用 narrow(b,e,def,v) 会 逐个 处 理 [b:e) 中 的 每 个 字符 ， 将 其 窄 化 版 本 放置 于 数组 v 中 
的 对 应 位 置 。 

一 般 设计 思想 是 narrow() 实现 从 一 个 大 字符 集 到 一 个 小 字符 集 的 转换 ， 而 widen() 则 
执行 相反 的 操作 。 对 于 小 字符 集中 的 字符 c 而 言 ， 我 们 期 望 : 


c == narrow(widen(c),0) /不 保证 成 功 


假如 c 表示 的 字符 在 “小 字符 集 ” 中 只 有 唯一 表示 ， 则 此 布尔 表达 式 为 真 。 但 这 并 不 能 得 到 
保证 。 如 果 char 表示 的 字符 并 不 是 大 字符 集 ( C) 所 表示 的 字符 的 子 集 ， 那 么 我 们 就 该 有 心 
理 准备 ， 以 一 般 方式 处 理 字符 的 代码 可 能 有 蜡 常 现象 和 潜在 问题 。 

类 似 地 ， 对 大 字符 集中 的 字符 ch 而 言 ， 我 们 期 望 : 


widen(narrow(ch,def)) == ch || widen(narrow(ch,def)) == widen(def) 咱 不 保证 成 功 


这 个 表达 通常 是 成 立 的 ,但 对 于 在 大 字符 集中 有 多 个 值 表 示 而 在 小 字符 集中 只 有 唯一 表示 的 
字符 ， 它 有 可 能 是 不 成 立 的 。 例 如 ， 一 个 数字 如 7， 在 大 字符 集中 通常 有 多 个 不 同 表 示 。 原 
因 在 于 一 个 大 字符 集 通 常 包含 多 个 常规 字符 集 作为 其 子 集 ， 因 此 来 自 小 字符 集中 的 字符 会 重 
复 多 次 以 便 转 换 。 

对 基本 源 字 符 集 ( 见 6.1.2 节 ) 中 的 每 个 字符 ,保证 有 : 

widen(narrow(ch_lit,0)) == ch_lit 
例如 : 

widen(narrow('x',0)) == 'x' 
函数 narrow() 和 widen() 会 尽 可 能 遵循 字符 分 类 。 例 如 ， 若 is(alpha,c) 为 真 ， 则 只 要 
alpha 是 所 用 locale 中 的 一 个 合法 掩 码 ， 则 is(alpha,narrow(c,'a')) 和 is(alpha,widen(c)) 都 
为 真 。 

将 ctype facet 用 于 一 般 情况 ， 而 将 narrow() 和 widen() 用 于 特殊 情况 的 主要 原因 是 ， 
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这 样 就 可 以 编写 适用 于 任意 字符 集 的 IO 和 字符 串 处 理 代码 ， 即 ， 可 以 使 得 这 类 代码 在 字符 
集 的 角度 来 看 是 通用 的 。 这 意味 着 iostream 的 实现 严重 依赖 这 些 特性 。 依 赖 <iostream> 和 
<string> ， 用 户 可 避免 直接 使 用 ctype facet。 

标准 库 也 提供 了 ctype 的 _byname 版 本 ( 见 39.4 节 和 39.4.1 节 ): 


template<class C> 

class ctype_byname : public ctype<C> { 
Hss 

}; 


39.4.6 ”字符 编码 转换 


有 了 时， 字符 在 文件 中 保存 的 表示 形式 与 用 户 要 求 其 在 内 存 中 的 表示 形式 不 吻合 。 例 
如 ， 文 件 中 保存 的 日 文字 符 通常 用 指示 符 (“ 移 位 ”) 指出 一 个 给 定 的 字符 序列 属于 四 种 常 
用 的 字符 集 (汉字 、 片 假名 、 平 假名 、 罗 马 字 ) 中 的 哪 种 。 这 种 方法 有 些 笨拙 ， 因 为 每 个 字 
节 的 含义 依赖 于 它 的 “ 移 位 状态 ”， 但 却 节省 空间 ， 因 为 只 有 汉字 表示 需要 超过 1 个 字 节 。 
在 内 存 中 ， 这 些 字符 用 多 字 节 字符 集 表示 ， 每 个 字符 都 有 相同 的 大 小 ， 从 而 更 易 处 理 。 这 
种 字符 (例如 ，Unicode 字符 ) 通常 保存 在 宽 字 符 类 型 (wchar_t; 见 6.2.3 节 ) 中 。 为 此 ， 
facet codecvt 提供 了 一 种 在 读 写 字符 时 将 其 从 一 种 表示 形式 转换 为 男 一 种 表示 形式 的 机 制 。 
例如 : 


磁盘 表示 : 






…]/0 转 换 ， 由 codecvt 控 制 


这 种 编码 转换 机 制 足 够 通用 ， 可 提供 任意 字符 表示 形式 间 的 转换 。 它 允许 我 们 编写 程序 使 用 
适合 的 内 部 字符 表示 形式 (保存 在 char、wchar_t 等 类 型 中 )， 并 通过 调整 iostream 使 用 的 
locale 来 接受 各 种 不 同 的 输入 字符 流 表示 形式 。 替 代 方 法 是 修改 程序 本 身 或 是 将 输入 输出 文 
件 转换 为 不 同 格式 。 

facet codecvt 提供 了 转换 机 制 ， 当 字符 在 流 缓冲 区 和 外 存 间 移动 时 可 进行 不 同 字 符 集 间 
的 转换 : 


class codecvt base{ 


内 存 表示 : 


public: 
enum result { 儿 结果 指示 器 
ok, partial, error noconv 


}; 


template<class In, class Ex, class SS> 
class codecvt : public locale::facet, public codecvt_base { 
public: 

using intern_type = In; 

using extern_type = Ex; 

using state_type = SS; 

Ms 
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codecvt<ln,Ex,SS> facet (iso.22.5 ) 
Using Cl = const In; using CE = const Ex; 
result in(SS& st, CE* b, CE* e, CE*& next, In* b2, In* e2, In*& next2) const; 
result out(SS& st, Cl* b, Cl* e, Cl*& next, Ex* b2, Ex* e2, Ex*& next2) const; 
result unshift(SS& st, Ex* b, Ex* e, Ex*& next) const; 
int encoding() const noexcept; 








bool always_noconv() const noexcept; 
int length(SS& st, CE* b, CE* e, size_t max) const; 
int max_length() const noexcept; 


facet codecvt 由 basic_filebuf ( 见 38.2.1 节 ) 使 用 来 读 写 字符 。basic_filebuf 从 流 的 locale 
中 获取 此 facet ( 见 38.1 节 )。 

模板 参数 State 是 用 来 保存 待 转 换 流 的 移 位 状态 的 类 型 。 通 过 生成 一 个 特例 化 版 本 ， 
State 还 可 用 来 辨别 不 同 的 转换 。 后 者 很 有 用 ， 因 为 不 同 编码 (字符 集 ) 的 字符 可 能 保存 在 
相同 类 型 的 对 象 中 。 例 如 

class JiSstate {/*.. */}; 


p= new codecvt<wchar tichanmbstate t>; // 标准 字符 转换 为 宽 字 符 
q = new codecvt<wchar t,char,JiSstate>; UI JIS 转换 为 宽 字 符 


如 果 没 有 不 同 的 State 实 参 ，facet 将 无 法 了 解 char 流 采 用 什么 编码 。mbstate_t 类 型 来 自 
<cwchar> 或 <wchar.h>， 可 辨别 char 和 wchar t 间 的 系统 标准 转换 。 

我 们 可 以 通过 派生 来 创建 新 的 codecvt， 并 通过 名 字 来 标识 它 。 例 如 : 

class JIScvt : public codecvt<wchar t,char,mbstate t> { 

1 

}; 
调用 in(st,b,e,next,b2,e2,next2) 读 取 [b:e) 中 的 每 个 字符 ， 尝 试 进行 转换 。 如 果 一 个 字符 转 
换 成 功 ，in() 将 其 转换 后 的 形式 写 入 [b2:e2) 中 的 对 应 位 置 ; 如 果 转 换 失 败 ，in() 将 停止 。 在 
返回 时 ，in() 将 最 后 一 个 读 取 的 字符 之 后 的 位 置 保存 在 next (下 一 个 要 读 取 的 字符 ) 中 ,将 
最 后 一 个 写 人 的 字符 之 后 的 位 置 保存 在 next2 (下 一 个 要 写 人 的 字符 ) 中 。in() 返回 的 result 
值 指出 工作 完成 了 多 少 : 


codecvt_base result (iso.22.4.1.4 ) 


ok [b:e) 中 的 所 有 字符 都 成 功 转换 
partial [b:e) 中 的 字符 并 未 全 部 转换 
error 某 个 字符 不 能 转换 

noconv 无 需 转 换 


注意 ， 一 次 partial 转换 不 一 定 意味 着 错误 。 有 可 能 是 为 了 转换 并 写 入 一 个 多 字 节 字符 必须 
读 取 更 多 字符 ,或 者 可 能 是 必须 清空 输出 缓冲 区 来 为 更 多 字符 腾 出 空间 。 

state_type 类 型 参数 st 指出 在 in() 调用 开始 时 刻 输入 字符 序列 的 状态 。 这 在 外 部 字符 
表示 使 用 移 位 状态 的 情况 下 是 很 重要 的 。 注 意 ，st 是 一 个 ( 非 const) 引用 参数 : 在 调用 结 
束 时 ，st 保存 输入 序列 的 最 新 移 位 状态 。 这 人 允许 程序 员 处 理 partial 转换 ， 以 及 多 次 调用 in() 
来 转换 一 个 长 序列 。 
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调用 out(st,b,e ,next,b2,e2,next2) 将 [b:e) 中 的 字符 从 内 部 表示 转换 为 外 部 表示 ， 与 
in() 从 外 部 表示 转换 为 内 部 表示 的 方式 相同 。 

一 个 字符 流 必须 以 “中 性 ”( 无 移 位 ) 状态 开始 和 结束 。 通 常 ， 这 种 状态 就 是 state_ 
type{}。 

调用 unshift(st,b,e,next) 查看 st， 并 按 需 要 放置 [b:e) 中 的 字符 以 便 将 序列 变 回 无 移 位 
状态 。unshift() 的 结果 和 next 的 使 用 与 out() 一 样 。 

调用 length(st,b,e,max) 返回 [b:e) 中 可 转换 的 字符 数 。 

encoding() 的 返回 值 含义 如 下 : 

-1 外 部 字符 集 的 编码 使 用 状态 (例如 ,使 用 移 位 和 无 移 位 字符 序列 )。 

0 编码 采用 可 变 长 度 字 符 ( 例 如， 字符 表示 可 能 用 字 节 中 的 一 位 来 指出 使 用 1 个 还 是 2 
个 字 节 表示 此 字符 )。 

n 外 部 字符 表示 的 每 个 字符 都 是 n 个 字 节 。 

如 果 内 部 和 外 部 字符 集 间 不 需要 进行 转换 ， 则 调用 always_noconv() 返回 true， 否 则 
返回 false。 显 然 , always_noconv()==true 为 最 大 程度 的 高 效 实现 一 一 不 调用 转换 函数 一 一 
提供 了 可 能 。 

调用 cvt.max_length() 的 返回 值 指出 了 cvt.length(ss,p,q,n) 对 一 组 合法 参数 能 返回 的 
最 大 值 。 

我 能 想象 的 最 简单 的 编码 转换 是 将 输入 转换 为 大 写 ， 它 大 概 是 能 提供 有 用 服务 的 最 简单 


的 codecvt 了 : 








class Cvt to_upper : public codecvt<char,char,mbstate_t> { // 转换 为 大 写 
public: 
explicit Cvt_ to upper(size tr=0):codecvt(r){} 


protected: 
// 读 外 部 表示 ， 写 内 部 表示 ; 
result do_in(State& s, 
const char* from, const char: from_end, const char*& from_next, 
char: to, char: to_end, char:*& to_next 
) const override; 


// 读 内 部 表示 ， 写 外 部 表示 ; 
result do_out(State& s, 
const char: from, const char: from_end, const char:& from_next, 
char: to, char* to_end, char*& to_next 
) const override; 
result do_unshift(State&, E: to, Ex to_end, E*& to_next) const override { return ok; } 


int do_encoding() const noexcept override { return 1; } 
bool do_always_noconv() const noexcept override { return false; } 


int do_length(const State&, const Ex from, const Ex from_end, size_t max) const override; 
int do_max_length() const noexcept override; 咱 可 能 的 最 大 length() 


} 


codecvt<char,char,mbstate t>::result 

Cvt to upper::do out(State& s, 
const char: from, const char: from_end, const char*& from_next, 
chart to, char: to_end, char*& to_next) const 
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return codecvt<char,char,mbstate_t>::do_out(s,from,from_end,from_next,to,to_end,to_next); 


} 


codecvt<char,char,mbstate_ t>::result 

Cvt to_upper::do_in(State& s, 
const char: from, const char* from_end, const char:& from_next, 
char: to, char* to_end, char:& to_next) const 


{ 
Ma 
} 
int main() // 简单 测试 
{ 
locale ulocaie(locale(), new Cvt_to_upper); 
cin.imbue(ulocale); 
for (char ch; cin>>ch; ) 
cout << ch; 
} 


标准 库 也 提供 了 codecvt 的 _byname 版 本 ( 见 39.4 节 和 39.4.1 节 ): 


template<class |, class E, class State> 
class codecvt_byname : public codecvt<l,E,State> { 
Hes 


六 
39.4.7 消息 


大 多 数 终端 用 户 自 然 更 喜欢 使 用 母语 同 程序 交互 。 但 是 ,我 们 无 法 提供 一 种 标准 机 制 来 
表达 locale 相关 的 通用 交互 。 取 而 代 之 的 是 ， 标 准 库 提供 了 一 种 简单 机 制 来 保存 一 组 locale 
相关 的 字符 串 ， 程 序 员 可 用 它们 组 合 出 简单 的 消息 。 本 质 上 ，messages 实现 了 一 种 简单 的 
只 读数 据 库 : 

class messages base{ 

public: 


using catalog =/* 具体 实现 定义 的 整数 类 型 */; /| 目录 标识 符 类 型 
}; 


template<class C> 
class messages : public locale::facet, public messages base{ 
public: 
using char type = C; 
using string_type = basic_string<C>; 
Miss 
} 


messages 接口 相当 简单 : 


messages<C> facet (iso.22.4.7.1) 





catalog open(const string& s, const locale& loc) const; 
string_type get(catalog cat, int set, int id, const basic_string<C>& def) const; 
void close(catalog cat) const; 
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调用 open(s,loc) 为 区 域 设置 loc 打开 一 个 名 为 s 的 消息 “目录 ”。 有 目录 就 是 一 组 字符 串 ， 组 
织 方式 由 具体 实现 确定 ， 通 过 函数 messages::get() 来 访问 。 如 果 没 有 名 为 s 的 目录 可 打 
开 ， 它 返回 一 个 负 值 。 目 录 必 须 在 首次 使 用 get() 前 打开 。 

调用 close(cat) 关闭 cat 标识 的 目录 ， 并 释放 目录 关联 的 所 有 资源 。 

调用 get(cat,set,id,"foo") 在 目录 cat 中 查找 由 (set,id) 标识 的 消息 。 如 果 找 到 ，get() 
返回 该 字符 串 ; 否则 ，get() 返回 默认 字符 串 (本 例 中 为 string("foo")) 。 

下 面 是 一 个 messages facet 的 例子 ， 此 实现 中 一 个 消息 目录 就 是 一 个 “消息 ”集合 的 
向 量 ， 而 一 个 “消息 ”就 是 一 个 字符 串 : 


struct Set { 
vector<string> msgs; 


}; 

struct Cat { 
vector<Set> sets; 

}» 


class My_messages : public messages<char>{ 
vector<Cat>& catalogs; 
public: 
explicit My_messages(size t= 0) :catalogs{:*new vector<Cat>} {} 


catalog do_open(const string& s, const locale& loc) const; // 打 开 s 
string do_get(catalog cat, int s, int m, const string&) const; // 获 取 cat 中 的 消息 (s,m) 
void do_close(catalog cat) const 


if (catalogs.size()<=cat) 
catalogs.erase(catalogs.begin()+cat); 


} 


“My_messages() { delete &catalogs; } 
}; 
messages 的 所 有 成 员 函 数 都 是 const 的 ， 因 此 目录 数据 结构 ( vector<Set>) 保存 在 facet 
之 外 。 
我 们 通过 指明 一 个 目录 、 目 录 中 的 一 个 集合 以 及 集合 中 的 一 个 消息 字符 串 来 选择 一 个 消 
息 。 我 们 还 要 提供 一 个 字符 串 参 数 ， 当 在 目录 中 找 不 到 消息 时 将 它 用 作 默 认 结 果 : 
string My_messages::do_get(catalog cat, int set, int id, const string& def) const 
{ 
if (catalogs.size()<=cat) 
return def; 
Cat& c = catalogs[cat]; 
if (c.sets.size()<=set) 
return def; 
Set& s = c.sets[set]; 
if (s.msgs.size()<=msg) 
return def; 
return s.msgs[id]; 


} 
打开 目录 的 操作 包括 从 磁盘 读 取 一 段 文 本 表示 存 人 一 个 Cat 结构 中 。 在 本 例 中 ， 我 选择 了 一 
种 容易 读 取 的 表示 形式 。 每 个 集合 用 <<< 和 >>> 框 定 ， 每 条 消息 就 是 一 行文 本 : 
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messages<char>::catalog My_messages::do_open(const string& n, const locale& loc) const 
{ 

string nn = n + locale().name(); 

ifstream f(nn.c_str()); 

if (If) return -1; 


catalogs.push_back(Cat{}); /1 创建 核心 目录 
Cat& c = catalogs.back(); 


for(string s; f>>s && s=="<<<", ){ 1 读 取 Set 
c.sets.push back(Set{}); 
Set& ss = c.sets.back!(); 
While (getline(f,s) && s != ">>>") /|/ 读 取消 息 
ss.msgs.push back(s); 


} 
return catalogs.size()-1; 
} 
下 面 是 一 个 简单 的 应 用 : 
int main({) 
1 一 个 简单 测试 
{ 
if (lhas_ facet<My_ messages>(locale())) { 
cerr << "no messages facet found in" << locale().name() << \n'; 
exit(1); 
} 
const messages<char>& m = use facet<My_messages>(locale()); 
extern string message_directory; /我 保存 消息 的 地 方 
auto cat = m.open(message directory,locale()); 
if (cat<0) { 
cerr << "no catalog found\n"; 
exit(1); 
} 
cout << m.get(cat,0,0,"Missed again!") << endl; 
cout << m.get(cat,1,2,"Missed again!") << endl; 
cout << m.get(cat,1,3,"Missed again!”) << endl; 
cout << m.get(cat,3,0,"Missed again!") << endl; 
} 
如 果 目 录 为 : 
< 
hello 
goodbye 
>»>> 
<<< 
yes 
no 
maybe 
>>> 
程序 会 输出 : 
heilo 
maybe 


Missed again! 
Missed again! 
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39.4.7.1 ”使 用 来 自 其 他 facet 的 消息 
除了 作为 一 个 保存 locale 相关 字符 串 的 仓库 ， 用 来 与 用 户 交 互 ，message 还 可 用 来 保 
存 来 自 其 他 facet 的 字符 串 。 例 如 ， 我 们 可 以 编写 Season_io facet ( 见 39.3.2 节 ) 如 下 : 


ciass Season_io : public locale::facet { 


const messages<char>& mi J 消息 目录 
messages base::catalog cat; /| 消息 目录 
pubilic: 


class Missing messages {); 


Season io(size_ti = 0) 
: locale::facet(i), 
m(use_ facet<Season messages>(locale())), 
cat(m.open(message directory,locale())) 


if (cat<0) 
throw Missing_messages(); 


; 

“Season_io() {} /| 为 了 可 以 销毁 Season io 对 象 ( 见 39.3 节 ) 

const string& to_str(Season x) const; //x 的 字符 串 表示 

bool from_str(const string& s, Season& x) const; // 将 s 对 应 的 Season 放 入 x 


static locale::id id; // facet 标识 符 对 象 ( 见 39.2 节 、39.3 节 和 39.3.1 节 ) 
好 


locale::id Season_io::id; // 定义 标识 符 对 象 


string Season _io::to_str(Season x) const 


{ 


return m->get(cat,0,x,"no-such-season"); 


} 
bool Season io::from_str(const string& s, Season& x) const 


for (int i = Season::spring; i<=Season::winter; i++) 
if (m->get(cat,0,i,"no-such-season") == s) { 
x= Season(i); 
return true; 


} 


return false; 


} 


基于 messages 的 解决 方案 与 最 初 方案 (39.3.2 节 ) 的 不 同 之 处 在 于 ,新 locale 的 Season 
字符 串 集 合 的 实现 者 需要 能 将 它们 添加 到 一 个 messages 目录 中 。 对 某 些 人 来 说 将 一 个 新 
locale 添加 到 执行 环境 中 很 容易 。 但 由 于 messages 只 提供 只 读 接 口 ， 添 加 一 个 新 的 季节 名 
字 集 合 可 能 会 超出 一 个 应 用 程序 实现 者 的 能 力 范围 。 

标准 库 也 提供 了 messages 的 _byname 版 本 ( 见 39.4 节 和 39.4.1 市 ): 


tempiate<class C> 

class messages_byname : public messages<C>{ 
11. 

上 
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39.5 ”便利 接口 


除了 简单 地 赋予 一 个 iostream 之 外 ，locale 特性 还 有 一 些 复杂 用 法 。 因 此 ， 标 准 库 提 
供 了 便利 接口 (convenience interface) 来 简化 符号 表示 、 减 少 错误 。 


39.5.1 字符 分 类 


facet ctype 最 常见 的 用 途 是 询问 一 个 字符 是 否 属于 某 个 给 定 类 别 。 因 此 ， 标 准 库 提供 了 
一 组 函数 来 完成 这 一 功能 : 


locale 敏感 的 字符 分 类 (iso.22.3.3.1 ) 


isspace(c,loc) 
isblank(c,loc) 
isprint(c,loc) 
iscntrl(c,loc) 
isupper(c,loc) 
islower(c,loc) 
isalphal(c,loc) 
isdigit(c,loc) 
ispunct(c,loc) 
isxdigit(c,loc) 
isalnum(c,loc) 


isgraph(c,loc) 


c 是 loc 中 的 一 个 空白 符 ? 

c 是 loc 中 的 一 个 空格 ? 

c 是 一 个 可 打印 字符 ? 

c 是 一 个 控制 字符 ? 

c 是 一 个 大 写字 母 ? 

c 是 一 个 小 写字 母 ? 

c 是 一 个 字母 ? 

c 是 一 个 十 进 制 数 字 ? 

c 不 是 字母 、 数 字 、 空 白 符 或 不 可 见 控制 字符 ? 
c 是 一 个 十 六 进 制 数字 ? 

isalpha(c) 或 isdigit(c) 

isalpha(c) 或 isdigit(c) 或 ispunct(c) (注意 : 不 包括 空白 符 ) 


这 些 函 数 都 是 使 用 use_facet 简单 实现 的 。 例 如 : 


template<class C> 
inline bool isspace(C c, const locale& loc) 


{ 


return use facet<ctype<C>>(loc).is(space.,c); 


} 
这 些 函 数 的 单 实 参 版 本 ( 见 36.2.1 节 ) 使 用 当前 的 C 全 局 区 域 设 置 。 除 了 极 少数 极 少数 情况 
下 C 全 局 区 域 设置 和 C++ 全 局 区 域 设 置 有 差异 ( 见 39.2.1 节 ) 这 外 ， 我 们 可 以 将 单 参数 版 
本 看 作 双 参数 版 本 将 locale() 作为 第 二 个 参数 。 例 如 : 


inline int isspacefint i) 


{ 
return isspace(i,locale()); 咱 差不多 等 价 
} 
39.5.2 ”字符 转换 


大 小 写 转 换 可 能 是 locale 敏感 的 : 


字符 转换 (iso.22.3.3.2.1 ) 


c2= toupper(c,loc) Use _facet<ctype<C>>(loc).toupper(c) 





c2= tolower(c,loc) use facet<ctype<C>>(loc).tolower(c) 
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39.5.3 字符 串 转换 


字符 编码 转换 可 以 是 locale 敏感 的 。 类 模板 wstring-convert 执行 宽 字符 串 和 字 节 字符 
串 之 间 的 转换 。 它 令 你 可 以 指定 一 个 编码 转换 facet (例如 codecvt) 来 进行 转换 ， 而 不 会 影 
响 任何 流 或 locale。 例 如 ， 你 可 能 直接 使 用 一 个 名 为 codecvt_utf8 的 编码 转换 facet 将 一 个 
UTF-8 多 字 节 序列 输出 到 cout， 而 不 会 影响 cout 的 locale: 


wstring_convert<codecvt_ utf8<wchar _t>> myconv; 
string s = myconyv.to_bytes(L"Hello\n"); 
cout << s,; 


wstring_convert 的 定义 采用 比较 常规 的 方式 : 


template<class Codecvt， 
class Wc = wchar t, 
class Wa = std::allocator<Wc>， lI wide-character allocator 
class Ba = std::allocator<char> I byte allocator 
> 
class wstring_convert { 
public: 
using byte_string = basic string<char, char_traits<char>, Ba>:; 
using wide string = basic_ string<Wc, char_ traits<Wc>, Wa>; 
using state_type = typename Codecvt::state type:; 
using int_type = typename wide string::traits type::int_type:; 
ee 
}; 
wstring_convert 构造 函数 允许 我 们 指定 一 个 字符 转换 facet、 一 个 初始 转换 状态 以 及 出 错时 
使 用 的 值 : 


wstring_conver t<Codecvt,Wc,Wa,Ba> (iso.22.3.3.2.2 ) 


wstring_convert cvt {}; wstring_convert cvt {new Codecvt}; 

wstring_convert cvt {pcvt,state} cvt 使 用 转换 facet *pcvt 和 转换 状态 state 

wstring_convert cvt {pcevt}; wstring_convert cvt {pcevt,state_type{}}; 

wstring_convert cvt {b_err,w_err}; wstring_convert cvt{}; 使 用 b_err 和 w_err 

wstring_convert cvt {b_err}; wstring_convert cvt{}; 使 用 b_err 

cvt.“wstring_convert(); 析 构 函数 

ws=cvt.from_bytes(c) ws 保存 char c 转换 为 Wc 的 结果 

WE pyle Ws 保存 s 中 char 转换 为 Wc 的 结果 ; s 是 一 个 C 风格 字符 串 或 一 个 
string 

ws=cvt.from_bytes(b,e) ws 保存 [b:e) 中 char 转换 为 Wc 的 结果 

s=cvt.to_bytes(wc) s 保存 wc 转换 为 char 的 结果 


s 保存 ws 中 Wc 转换 为 char 的 结果 ; ws 是 一 个 C 风格 字符 串 或 一 个 


s=Ccvt.to_bytes(ws) paslo, stringeWes 


s=cvt.to_bytes(b,e) s 保存 [b:e) 中 Wc 转换 为 char 的 结果 
n=cvt.converted() n 为 被 cvt 转换 的 输入 元 素 个 数 
st=cvt.state() st 是 被 cvt 的 状态 


如 果 转 换 为 wide_string 失败 ， 这 些 cvt 上 的 函数 返回 构造 cvt 时 使 用 的 那个 非 默认 w_err 
的 字符 串 (错误 消息 ); 若 构造 时 未 提供 此 字符 串 ， 这 些 函 数 会 抛 出 range_error。 
如 果 转 换 为 byte_string 失败 ， 这 些 cvt 上 的 函数 返回 构造 cvt 时 使 用 的 那个 非 默 认 b_ 
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err 的 字符 串 (错误 消息 ); 若 构造 时 未 提供 此 字符 串 ， 这 些 函 数 会 抛 出 range_error。 
一 个 示例 如 下 : 


void test() 
{ 


wstring_convert<codecvt utf8 utf16<wchar t>> converter; 


string s8 = u8"This is a UTF-8 string"; 
wstring s16 = converter.from_bytes(s8); 
string s88 = converter.to_bytes(s16); 


if (s8!=s88) 
cerr <"Insane!\n"; 


39.5.4 缓冲 区 转换 
我 们 可 以 用 一 个 编码 转换 facet ( 见 39.4.6 节 ) 直接 读 写 流 缓冲 区 ( 见 38.6 节 ) 


template<class Codecvt, 
class C = wchar t, 
class Tr = std::char traits<C> 
> 
class wbuffer_convert 
: public std::basic_ streambuf<C,Tr>{ 
public: 
using state_type = typename Codecvt::state_type; 
We 
} 


wbuffer_conver t<Codecyvt,C, Tr> (iso.22.3.3.2.3 ) 
wbuffer_convert wb {psb,pcvt,state}; “wb 从 streambuf *psb 转换 ， 使 用 转换 器 *pcvt 和 初始 转换 状态 state 





wbuffer_convert wb {psb,pcvt}; wbuffer_convert wb {psb,pcvt,state_type{}}; 
wbuffer_convert wb {psb}; wbuffer_convert wb {psb,new Codecvt{}}; 
wbuffer_convert wb {}; wbuffer_convert wb {nullptr}; 
psb=wb.rdbuf() psb 是 wb 的 流 缓冲 区 
psb2=wb.rdbuf(psb) 将 wb 的 流 缓冲 区 设置 为 *psb; *psb2 是 wb 的 旧 的 流 缓 冲 区 
t=wb.state() t 是 wb 的 转换 状态 
39.6 建议 
[1] 做 好 每 个 与 用 户 直接 交互 的 重要 程序 或 系统 都 会 在 多 个 不 同 国家 使 用 的 准备 ; 
39.1 节 。 
[2 ] 不 要 假定 每 个 人 都 像 你 一 样 使 用 相同 的 字符 集 ; 39.1 节 ，39.4.1 节 。 
[3 ] 优先 使 用 locale 为 文化 敏感 的 IO 编写 专门 的 代码 ; 39.1 节 。 
[4 ] 使 用 locale 满足 外 部 ( 非 C++) 标准 的 需求 ; 39.1 节 。 
[5 ] 将 locale 视 为 facet 的 容器 ; 39.2 节 。 
[ 6] 避免 在 程序 文本 中 嵌入 locale 名 字 字 符 串 ; 39.2.1 节 。 
[7] 保持 仅 在 程序 中 少数 地 方 修改 locale; 39.2.1 节 。 
[8 ] 尽量 少 使 用 全 局 格式 信息 ; 39.2.1 节 。 
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[9] 优先 选择 locale 敏感 的 字符 串 比 较 和 排序 ; 39.2.2 节 ，39.4.1 节 。 


[ 10 
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[13] 


[14] 
[15] 
[16] 


[17] 





[18] 


令 facet 不 可 变 ; 39.3 节 。 

今 locale 处 理 facet 的 生命 周期 ，39.3 节 。 

你 可 以 创建 自己 的 facet; 39.3.2 节 。 

当 编 写 locale 敏感 的 IO 函数 时 ， 记 得 处 理 来 自用 户 提供 的 (覆盖 ) 函数 的 异 
常 ; 39.4.2.2 节 。 

如 果 需 要 在 数值 内 使 用 分 隔 符 ， 使 用 numput; 39.4.2.1 节 。 

使 用 简单 Money 类 型 保存 货币 值 ; 39.4.3 节 。 

使 用 简单 用 户 自 定义 类 型 保存 要 求 locale 敏感 IO 的 值 (而 不 是 将 其 与 内 置 类 型 
值 进行 转换 ); 39.4.3 节 。 

facet time_put 既 可 用 于 <chrono> 风格 的 时 间 ， 也 可 用 于 <ctime> 风格 的 时 间 ; 
39.4.4 节 。 

在 显 式 使 用 locale 时 ， 优 先 选 择 字 符 分 类 函数 ; 39.4.5 节 ，39.5 节 。 





第 40 各 | 


The C++ Programming Language, Fourth Edition 


数值 计算 


计算 的 意义 在 于 洞察 力 ， 而 非 数字 本 身 。 
一 一 理 查 德 ，W ' 汉 明 


一 一 人 A， 罗 尔 斯 顿 


e@ 
型 
此 


e 数值 限制 
数值 限制 宏 
标准 数学 函数 
e 复数 complex 
数值 数组 : valarray 
构造 函数 和 赋值 操作 ; 下 标 操作 ; 运算 ; 切片 ; slice_array; 推广 切片 
推广 数值 算法 
accumulate(); inner_product(); partial_sum() 和 adjacent_ difference(); iotal() 
随机 数 
引擎 ; 随机 设备 ; 分 布 ; C 风格 随机 数 

。 建 议 
40.1 引言 

数值 计算 并 不 是 C++ 的 主要 设计 目标 之 一 。 但是， 数值 计算 通常 会 出 现在 其 他 工作 之 
中 一 一 如 数据 库 访 问 、 网 络 传输 、 仪 器 控制 、 图 形 学 、 仿 真 以 及 金融 分 析 一 一 因此 C++ 也 
成 为 构造 大 型 系统 中 计算 部 分 的 有 吸引 力 的 工具 。 而 且 ， 数值 方法 已 经 取得 了 很 大 进展 ,不 
再 仅仅 是 浮 点 数 向 量 上 的 简单 循环 了 。 当 复杂 数据 结构 是 计算 过 程 中 的 必要 部 分 时 ，C++ 的 
优势 就 变 得 很 重要 了 。C++ 因而 被 广泛 用 于 科学 计算 、 工 程 计算 、 金 融 计算 以 及 其 他 包含 复 
杂 数 值 计算 的 任务 ， 这 催生 了 支持 这 类 计算 的 语言 特性 和 技术 。 本 章 介 绍 标准 库 中 支持 数值 
计算 的 部 分 。 我 不 打算 讲授 数值 方法 。 数 值 计 算 本 身 就 是 一 个 吸引 人 的 话题 。 学 习 数 值 计 算 
需要 一 门 好 的 数值 方法 课程 或 者 至 少 有 一 本 好 的 教材 一 一 而 不 是 仅 靠 一 本 编程 语言 手册 和 导 
引 就 能 完成 的 。 

除了 本 章 介绍 的 标准 库 特 性 外 ， 第 29 章 也 提供 了 一 个 数值 计算 编程 的 延伸 范例 : 实现 
N 维和 矩阵 。 


40.2 数值 限制 
为 了 处 理 数值 相关 的 有 趣事 情 ， 我 们 通常 需要 了 解 一 些 内 置 数值 类 型 的 一 般 特 性 的 知 





盆 40 竟 阁 信 计算 253 























识 。 为 了 证 程序 员 能 最 充分 地 利用 硬件 ， 这 些 特性 都 是 依赖 于 具体 C++ 实现， 而 不 是 由 
语言 本 身 规定 的 ( 见 6.2.8 节 )。 例 如 ， 最 大 的 int 有 多 大 ? 最 小 的 正 float 是 什么 ?将 一 个 
double 赋予 一 个 float 时 ， 是 售 人 还 是 截断 ? 一 个 char 有 多 少 位 ? 

这 类 问题 的 答案 由 numeric_limits 的 特例 化 版 本 提供 ， 它 定义 在 <limits> 中 。 例 如 : 


void f(double d, int 1) 
{ 





char classificationfnumeric_limits<unsigned char>::max()]; 


if (numeric_limits<unsigned char>::digits==numeric_limits<char>::digits ) { 
/char 是 无 符号 的 
} 


if (i<numeric_limits<short>::min() || numeric_limits<short>::max()<i) { 
/ii 保存 在 short 中 必然 损失 精度 
} 


if (0<d && d<numeric limits<double>::epsilon()) d= 0; 


if (numeric_limits<Quad>::is_specialized) { 
/1 Quad 类 型 的 有 限制 信息 
} 
} 


每 个 特例 化 版 本 提供 其 实 参 类 型 的 相关 人 信息。 因此， 通用 numeric_limit 模板 就 是 一 组 常量 
和 constexpr 函数 的 标志 句柄 : 


template<typename T> 
class numeric_limits { 
public: 
static const bool is_specialized = false; // numeric limits<T> 的 信息 可 用 ? 
乏味 的 默认 值 .… 
}; 


ade 所 有 C++ 实现 都 为 每 种 基本 数值 类 型 (字符 类 型 、 整 数 类 
、 浮 点 类 型 和 bool) 提供 了 一 个 numeric_limits 特例 化 版 本 ,但 不 会 为 任何 其 他 看 似 合理 
Ca， 例如 void 、 枚 举 或 库 类 型 (例如 complex<double> ) 。 
对 于 char 这 样 的 整数 类 型 ， 我 们 只 对 很 少 的 一 些 信息 感 兴趣 。 下 面 是 某 个 C++ 实现 中 
的 numeric_limits<char>， 包 含 的 信息 包括 char 有 8 位 、 是 带 符号 类 型 : 


template<> 
class numeric_ limits<char> { 
public: 
static const bool is_specialized = true; // 是 的 ， 有 相关 信息 





static const int digits = 7; 放 位 数 (“二 进 制 数 字 ” 数 )， 不 包括 符号 
static const bool is_signed = true; 儿 此 实现 中 char 是 带 符号 类 型 
static const bool is_integer = true; lichar 是 一 种 整数 类 型 


static constexpr char min() noexcept { return -128; } /最 小 值 
static constexpr char max() noexcept { return 127; } 儿 最 大 值 


/大 量 声明 与 char 无 关 
} 


这 些 函 数 都 是 constexpr 的 ， 因 此 它们 可 用 作 常 量 表 达 式 且 没 有 运行 时 开销 。 


254 淄 四 部 分 村 准 大 








大 多 数 numeric_limits 成 员 是 用 来 描述 浮 点 数 的。 例如 ， 下 面 的 代码 描述 了 float 的 一 
种 可 能 实现 : 


template<> 
class numeric limits<float> { 
public: 
static const bool is_specialized = true; 


static const int radix = 2; 咱 指 数 的 基数 (在 本 例 中 是 二 进 制 的 ) 
static const int digits = 24; 外 尾数 中 基数 数字 的 数量 
static const int digits10 = 9; 儿 尾数 中 十 进 制 数字 的 数量 


static const bool is_signed = true; 
static const bool is_integer = false; 
static const bool is_exact = false; 


static constexpr float min() noexcept { return 1.17549435E-38F; } // 最 小 正 数 
static constexpr float max() noexcept { return 3.40282347E+38F; }// 最 大 正 数 
static constexpr float lowest() noexcept { return -3.40282347E+38F; } // 最 小 值 


static constexpr float epsilon() noexcept { return 1.19209290E-07F; } 
static constexpr float round_error() noexcept { return 0.5F; } 儿 最 大 含 入 误差 


static constexpr float infinity() noexcept { return /* 某 个 值 */; } 

static constexpr float quiet_NaN() noexcept { return /* 茶 个 值 */; } 
static constexpr float signaling_NaN() noexcept { return /* 某 个 值 */;》 
static constexpr float denorm_min() noexcept { return min(); } 


static const int min_exponent = -125; 
static const int min_exponent10 = -37; 
static const int max_exponent = +128; 
static const int max_exponent10 = +38; 


static const bool has_infinity = true; 

static const bool has_quiet NaN = true; 

static const bool has_signaling_NaN = true; 

static const float_denorm_style has_denorm = denorm_absent; 
static const bool has_denorm_loss = false; 


static const bool is_iec559 = true; // 服从 IEC-559 标准 
static const bool is_bounded = true; 

static const bool is_modulo = false; 

static const bool traps = true; 

static const bool tinyness_before = true; 


static const float_round_style round_style = round to_nearest; 

上 
注意 ，min() 返回 的 是 最 小 的 正 (positive) 归 一 化 数值 ， 而 epsilon 则 是 满足 1+epsilon-1 大 
于 0 的 最 小 正 浮 点 数 。 

当 按照 内 置 类 型 的 模式 定义 一 个 标量 类 型 时 ， 最 好 为 其 提供 恰当 的 numeric_limits 特 
例 化 版 本 。 例 如 ， 如 果 我 编写 一 个 四 倍 精度 类 型 Quad， 用 户 很 可 能 希望 我 提供 numeric_ 
limits<Quad>。 反 之 ， 如 果 我 使 用 一 个 非 数 值 类 型 Dumb_ptr， 我 可 能 希望 numeric_ 
limits<Dumb_ptr<X>> 是 主 模板 ， 其 is_specialized 设置 为 false， 表 示 并 无 数值 限制 信息 。 





对 于 与 浮 点 数 没 有 太 大 关系 的 用 户 自 定义 类 型 ,我 们 可 以 想象 描 
limits 特例 化 版 本 是 什么 样 的 。 对 此 情况 ,使 用 通用 的 类 型 属性 描 
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numeric_limits 来 描述 非 标准 属性 要 更 好 一 些 。 


40.2.1 数值 限制 宏 


C++ 从 C 继承 了 描述 整数 属性 的 宏 ， 它们 定义 在 <climits> 中 : 


整数 限制 宏 ((_iso.diff.library_， 简 略 的 ) 


述 
述 


其 属性 的 numeric 


技术 通常 比特 例 化 





CHAR_BIT 一 个 char 有 和 多少 位 (通常 为 8) 

CHAR_MIN 最 小 char 值 (可 能 为 负 ) 

CHAR_MAX 最 大 char 值 (如 char 是 带 符 号 类 型 ， 通常 为 127; 如 char 是 无 符号 类 型 ， 通 常 为 255 ) 
INT_MIN 最 小 int 值 

LONG_MAX 最 大 long 值 


标准 库 也 为 signed char、long long 等 类 型 提供 了 类 似 的 命名 宏 。 
类 似 地 ，<cfloat> 和 <float.h> 定义 了 描述 浮 点 数 属性 的 宏 : 


浮 点 数 限制 宏 ((_iso.diff.library_， 简 略 的 ) 








FLT_MIN 最 小 正 float 值 (如 1.175494351e-38F) 
FLT_MAX 最 大 float 值 (如 3.402823466e+38F) 

FLT_DIG float 精度 所 能 表示 的 十 进 制 位 数 (如 6) 
FLT_MAX_10_EXP 一 个 float 最 大 的 十 进 制 指 数 (如 38) 

DBL_MIN 最 小 double 值 

DBL_MAX 最 大 double 值 (如 1.7976931348623158e+308) 
DBL_EPSILON 满足 1.0+DBL_EPSILON!=1.0 的 最 小 double 值 


标准 库 也 为 long double 提供 了 类 似 的 命名 宏 。 


40.3 标准 数学 函数 


在 <cmath> 中 我 们 可 以 找到 通常 被 称 为 标准 数学 函数 (Standard Mathematical Function) 


的 组 件 : 
标准 数学 函数 
abs(x) 绝对 值 
ceil(x) >=x 的 最 小 整数 
floor(x) <=X 的 最 大 整数 
sqrt(x) 平方 根 ; x 必须 是 非 负 的 
cos(x) 余弦 
sin(x) 正弦 
tan(x) 正切 
acos(x) 反 余弦 ; 结果 非 负 
asin(x) 反正 弦 ; 返回 最 接近 0 的 结果 
atan(x) 反正 切 
sinh(x) 双 曲 正弦 
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( 续 ) 
标准 数学 函数 
cosh(x) 双 曲 余弦 
tanh(x) 双 曲 正切 
exp(x) e 的 指数 
log(x) 以 e 为 底 的 自然 对 数 ; x 必须 为 正 
log10(x) 以 10 为 底 的 对 数 


这 些 函 数 都 有 接受 float 、double 、long double 和 complex ( 见 40.4 节 ) 参数 的 版 本 。 对 每 
个 版 本 ， 返 回 类 型 与 参数 类 型 一 致 。 

为 报告 定义 域 错 误 ， 这 些 函 数 会 将 来 自 <cerrno> 的 errno 设置 为 EDOM， 对 值 域 错 
误 , 会 将 errno 设置 为 ERANGE。 例 如 : 

void f() 


{ 


} 


errno = 0; // 清除 旧 的 错误 状态 

sqrt(-1); 

if (errno==EDOM) cerr << "sqrt() not defined for negative argument ; 
pow(numeric_limits<double>::max(),2); 

if (errno == ERANGE) cerr << “result of pow() too large to represent as a double"; 


由 于 历史 原因 ， 少 数 数 学 函数 在 <cstdlib> 中 而 不 是 <cmath> 中 。 


更 多 数学 函数 (iso.26.8 ) 





n2=abs(n) 绝对 值 ; n 为 int、long 或 long long; n2 与 n 类 型 相同 
n2=labs(n) “长 绝对 值 *; n 和 n2 都 是 long 

n2=llabs(n) “ 超 长 绝对 值 "; n 和 n2 都 是 long long 

p=div(n,d) p=div(n,d) 

p=ldiv(n,d) n 除 以 d; p 为 [ 商 , 余数 ]; n 和 d 都 是 long 


p=lldiv(n,d) 


n 除 以 d; p 为 [ 商 ， 余 数 ]; 


n 和 d 都 是 long long 


LS 
struct。 这 些 struct 都 有 成 员 quot (保存 商 ) 和 rem (保存 余数 )， 其 类 型 是 由 具体 C++ 实现 


定义 的 。 


专用 数学 函数 (special mathematical functions) 有 独立 的 ISO 标准 [C++Math, 2010]。 
具体 C++ 实现 可 能 将 这 些 函 数 添加 到 <cmath> 中 : 


assoc_laguerre() 
comp_ellint_2() 
cyl_bessel_k() 
ellint_3() 
legendre() 
sph_neumann() 


如 果 你 不 知道 这 些 函 


专用 数学 函数 ( 可 选 的 ) 


assoc_legendre() 
comp_ellint_3() 
cyl_neumann() 
expint() 
riemann_z eta() 


函数 ， 很 可 能 就 不 需要 它们 。 


beta() 
cyl_bessel i() 
ellint_1() 
hermite() 
sph_bessel() 


comp_ellint_1() 
cyl_bessel j() 
ellint_2() 
laguerre() 
sph_legendre() 
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40.4 复数 complex 


标准 库 提 供 了 复数 类 型 complex<float> 、complex<double> 和 complex<long double>。 
对 其 他 支持 常见 算术 运算 的 类 型 Scalar，complex<Scalar> 通常 也 能 正常 工作 ， 但 不 保证 可 
移植 。 


template<typename Scalar> 
class complex { 
// 一 个 complex 就 是 一 对 标量 值 ， 可 认为 是 一 个 坐标 对 
Scalar re, im; 
public: 
complex(const Scalar & r = Scalar{}, const Scalar & i = Scalar{}) :re(r), im(i) { } 


Scalar real() const { return re; } /| 实 部 
void real(Scalar r) { re=r; } 
Scalar imag() const { return im; } 咱 虚 部 


void imag(Scalar i) {im = i; } 


template<typename X> 
complex(const complex<X>&); 


complex<T>& operator=(const T&); 
compiex& operator=(const complex&); 
template<typename X> 

complex<T>& operator=(const complex<X>&); 


complex<T>& operator+=(const T&); 
template<typename X> 
complex<T>& operator+=(const complex<X>&); 


/运算 符 -=, *=, /= 类 似 
}; 


标准 库 complex 不 能 避免 窗 化 : 


complex<float> z1 = 1.33333333333333333;”// 窄 化 
complex<double> z2 = 1.33333333333333333;// 窄 化 
z1=2z2; 儿 窗 化 


为 避免 意外 的 罕 化 ， 应 使 用 分 初始 化 : 


complex<float> z3 {1.33333333333333333}; ”// 错误 : 窄 化 转换 
除了 complex 的 成 员 之 外 ，<complex> 还 提供 了 许多 有 用 的 操作 : 


complex 运算 符 


Z1+Z2 加 法 

z1-z2 减法 

Z1*z2 乘法 

z1/z2 除法 

z1==z2 相等 判断 

z1!=z2 不 等 判断 

norm(z) abs(z) 的 平方 
conj(z) 共 轿 : {z.re,-z.im} 


polar(x,y) 给 定 一 个 极 坐 标 (rho，theta) 创建 一 个 复数 
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( 续 ) 
complex 运算 符 
real(z) 实 部 
imag(z) 虚 部 
abs(z) 到 (0,，0 ) 的 距离 : sqrt(z.re*z.re+z.im*z.im); 也 被 称 为 rho 
arg(z) 距 正 实 轴 的 角度 : atan2(z.im/z.re); 也 被 称 为 theta 
out<<z 输出 复数 
in>>z 输入 复数 


标准 数学 函数 ( 见 40.3 节 ) 也 支持 复数 。 注 意 ，complex 没有 提供 < 或 %。 更 多 细节 请 见 
18.3 节 。 


40.5 数值 数组 : valarray 


很 多 数值 计算 依赖 于 相对 简单 的 一 维 浮 点 值 向 量 。 特 别 是 ， 高 性 能 机 器 体系 结构 能 很 好 
地 支持 这 种 向 量 ， 依 赖 这 种 向 量 的 库 也 已 被 广泛 使 用 ， 对 使 用 这 种 向 量 的 代码 进行 大 力度 优 
化 对 很 多 领域 也 非常 重要 。<valarray> 中 的 valarray 是 一 种 一 维 数值 数组 ， 它 提供 了 数组 
类 型 上 的 常用 数值 向 量 算术 运算 以 及 切片 和 跨 距 操 作 : 


数值 数组 类 (iso.26.6.1 ) 





valarray<T> 类 型 T 的 数值 数组 

slice 类 BLAS 的 切片 操作 (指出 起 始 位 置 、 长 度 和 跨 距 ); 见 40.5.4 节 
slice_array<T> 切片 描述 的 一 个 子 数组 ; 见 40.5.5 节 

gslice 推广 的 切片 ， 描 述 一 个 矩阵 

gslice _array<T> 推广 的 切片 描述 的 子 和 矩阵 ; 见 40.5.6 节 

mask_array<T> 掩 码 标识 的 数组 子 集 ; 见 40.5.2 节 

indirect_array<T> 索引 列表 标识 的 数组 子 集 ; 见 40.5.2 节 


valarray 的 基本 思想 是 提供 类 Fortran 的 稠密 多 维 数 组 处 理 特性 以 及 优化 的 机 会 。 这 只 有 在 
编译 器 和 优化 器 的 积极 支持 下 ， 以 及 在 valarray 基本 特性 基础 上 的 更 多 库 的 支持 下 才能 实 
现 。 到 目前 为 止 , 并 非 所 有 C++ 实现 都 能 实现 这 些 。 


40.5.1 构造 函数 和 赋值 操作 
valarray 构造 函数 允许 我 们 从 辅助 数值 数组 类 型 和 单个 值 初始 化 valarray : 


valarray<T> 构造 函数 (iso.26.6.2.2 ) 


valarray vaf}; 没有 元 素 的 valarray 

valarray va {n}; 包含 n 个 值 为 T{} 的 元 素 的 valarray; 显 式 构造 函数 
valarray va {t,n}; 包含 n 个 值 为 t 的 元 素 的 valarray 

valarray va {p,n}; 包含 n 个 元 素 的 valarray， 无 素 值 拷贝 自 [p:p+n) 
valarray va {v2}; 移动 和 拷贝 构造 函数 


用 来 自 a 的 元 素 构造 va ; a 可 以 是 一 个 slice_array、gslice_array、mask_array 
或 indirect_array; 元 素数 与 a 中 的 元 素数 相同 
valarray va {args}; 用 initializer_list {args} 构造 ; 元 素数 与 {fargs} 中 的 元 素数 相同 
va.“valarray() 析 构 函数 


valarray va {a}; 
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例如 : 
valarray<double> v0; 咱 占 位 符 ， 我们 可 以 稍 后 对 v0 赋值 
valarray<float> v1(1000); W11000 元 素 ， 值 为 oatO==0.0F 
valarray<int> v2(-1,2000); J12000 个 元 素 ， 值 为 -1 
valarray<double> v3(100,9.8064); 儿 糟糕 的 错误 : valarray 的 大 小 为 浮 点 数 
valarray<double> v4 = v3; J1v4 有 v3.size() 个 元 素 
valarray<int> v5 {~1,2000}; 1/ 两 个 元 素 


在 双 参 数 的 构造 函数 中 ， 元 素 值 在 元 素 个 数 之 前 。 这 与 标准 容器 的 习惯 不 同 ( 见 31.3.2 节 )。 
传递 给 拷贝 构造 函数 的 valarray 参数 的 元 素数 决定 了 结果 valarray 的 元 素数 。 
大 多 数 程 序 需 要 用 来 自 表格 或 其 他 输入 源 的 数据 初始 化 valarray。 除 了 初始 化 器 列表 机 
制 ， 从 内 置 数组 拷贝 元 素 的 构造 函数 也 对 此 提供 了 支持 。 例 如 : 


void f(const int* p, int n) 


{ 
const double vd[] = {0,1,2,3,4}; 
const int vif] = {0,1,2,3,4}; 
valarray<doubie> v1{vd,4}; // 四 个 元 素 : 0,1,2,3 
valarray<double> v2{vi,4}); 咱 类 型 错误 : vi 不 是 double 指针 
valarray<double> v3{vd,8}; 外 未 定义 : 初始 化 器 列表 中 元 素数 过 少 
valarray<int> v4{p,n}; lp 最 好 指向 至 少 n 个 int 

} 


valarray 及 其 辅助 特性 是 为 高 速 计 算 而 设计 的 。 这 反映 在 对 用 户 的 一 些 限制 上 以 及 给 予 
实现 者 的 一 些 自由 上 。 基 本 上 ，valarray 的 实现 者 可 以 使 用 能 想到 的 几乎 所 有 优化 技术 。 
valarray 操作 被 假定 没有 副作用 (当然 ， 对 其 显 式 参 数 的 影响 除外 )，valarray 被 假定 可 以 自 
由 取 别 名 ， 且 人 允许 引入 辅助 类 型 以 及 去 掉 临 时 变量 ， 只 要 基本 语义 得 以 保持 即 可 。valarray 
不 支持 范围 检查 。valarray 的 元 素 类 型 必须 具有 默认 的 拷贝 语义 ( 见 8.2.6 节 )。 

我 们 可 以 在 valarray 与 另 一 个 valarray 、 一 个 标量 或 一 个 valarray 子 集 间 进 行 赋值 : 


valarray<T> 赋值 (iso.26.6.2.3 ) 





va2=va 拷贝 赋值 : va2.size() 变 为 与 va.size() 一 样 

va2=move(va) 移动 赋值 ，va 变 为 空 

va=t 标量 赋值 : va 的 每 个 元 素 都 变 为 t 的 一 份 拷贝 

va={args} 从 initializer_list {args} 赋值 ;va 的 元 素数 变 为 {args}.size() 

va=a 从 a 赋值 ， a.size() 必须 与 va.size() 相 等 ; a 可 以 是 一 个 slice_array、gslice_array、 
mask_array 或 indirect_array 

va@=va2 对 va 的 每 个 元 素 执 行 vali]@=va2[i]; @ 可 以 是 *、/、%、+、-、^、&、|、<< 或 >> 

va@=t 对 va 的 每 个 元 素 执行 vali]@=t; @ 可 以 是 *、/、% 、+ 、-、^、& 、|、<< 或 >> 


我 们 可 以 将 一 个 valarray 赋予 另 一 个 同样 大 小 的 valarray。 正 如 所 料 ，v1=v2 将 v2 的 每 个 
元 素 拷贝 到 v1 中 的 对 应 位 置 。 若 两 个 valarray 大 小 不 同 ， 赋 值 结果 是 未 定义 的 。 

除了 这 种 常规 赋值 ， 我 们 还 可 以 将 一 个 标量 赋予 一 个 valarray。 例 如 ，v=7 将 7 赋予 
valarray v 的 每 个 元 素 。 这 对 某 些 程序 员 来 说 很 奇怪 ,最 好 将 其 理解 为 赋值 运算 符 的 一 种 侦 
尔 很 有 用 的 退化 形式 。 例 如 : 





valarray<int> v {1,2,3,4,5,6,7,8}; 
V +*= 2; lv=—={2,4,6,10,12,14,16} 
v=7; I v=—={7,7,7,7,7,7,7,7} 


40.5.2 下 标 操 作 
我 们 可 以 用 下 标 操 作 选 择 valarray 的 一 个 元 素 或 一 个 元 素 子 集 : 
valarray<T> 下 标 操作 (iso.26.6.2.4，iso.26.6.2.5 ) 


t=vali] 下 标 操作 : t 为 指向 va 的 第 i 个 元 素 的 引用 ; 无 范围 检查 
a2=va[x] 子 集 操作 : x 可 以 是 一 个 slice、gslice、valarray<bool> 或 valarray<size t> 





每 个 operator[] 返回 来 自 valarray 的 元 素 子 集 。 返 回 类 型 (表示 子 集 的 对 象 的 类 型 ) 依赖 于 
实 参 类 型 。 

对 const 实 参 ， 返 回 结 果 包 含 元 素 的 拷贝 。 对 非 const 实 参 ,返回 结果 包含 指向 元 素 的 
引用 。 由 于 C++ 不 直接 支持 引用 的 数组 (例如 ， 我 们 不 能 声明 valarray<int&>)， 具 体 实现 
会 用 某 种 方法 进行 模拟 ， 这 是 可 以 高 效 实现 的 。 下 面 给 出 下 标 操作 的 详细 列表 ， 每 种 情况 都 
带 有 示例 (基于 iso.26.6.2.5 ) 。 每 种 情况 下 ， 下 标 描 述 了 要 返回 的 值 ，v1 必须 是 具有 恰当 长 
度 和 元 素 类 型 的 valarray: 

e const valarray 的 slice : 


valarray<T> operator[](siice) const;// 元 素 拷贝 

J 5 

const valarray<char> v0 {"abcdefghijkimnop",16}; 
valarray<char> v1 {v0fslice(2,5,3)]}; I {"cfilo",5} 


e 非 const valarray 的 slice: 


slice_array<T> operatorn(slice);  // 元 素 引 用 

hl... 

valarray<char> v0 {"abcdefghijkiImnop",16}; 
valarray<char> v1 {"ABCDE",5)}; 

vO[slice(2,5,3)] = v1; ll v0=={f"abAdeBghCjkDmnEp",16} 


e const valarray 的 gslice: 


valarray<T> operator[](const gslice&) const; // 元 素 拷贝 

ll... 

const valarray<char> v0 {"abcdefghijkimnop",16}; 

const valarray<size_t> len {2,3}; 

const valarray<size_t> str {7,2}; 

valarray<char> v1 {vO[gslice(3,ien,str)]}; ll v1l=={"dfhkmo",6} 


非 const valarray 的 gslice: 


gslice_array<T> operator[](const gslice&); /|/ 元素 引 用 

Ws 

valarray<char> v0 {"abcdefghijkiImnop",16}; 

valarray<char> v1 {"ABCDE",5}; 

const valarray<size_t> len {2,3}; 

const valarray<size_t> str {7,2}; 

v0[gsiice(3,len,stn] = v1; ll v0=={f"abcAeBgCijDIEnFp",16} 


e const valarray 的 valarray<bool> ( 掩 码 ): 
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valarray<T> operator[](const valarray<bool>&) const; /| 元素 拷贝 

ll... 

const valarray<char> v0 {"abcdefghijkImnop",16}; 

const bool vbf] {false, false, true, true, false, true}; 

valarray<char> v1 {vO[valarray<boo!>(vb, 6)]}; I v1l=—{"cdf"',3} 


e 非 const valarray 的 valarray<bool> ( 掩 码 ). 


mask_array<T> operator[](const valarray<bool>&); 中 元 素 引 用 
hs 

valarray<char> v0 {"abcdefghijkiImnop", 16); 

valarray<char> v1 {"ABC",3)}; 

const bool vbf] {false, false, true, true, false, true}; 
v0fvalarray<bool>(vb,6)] = v1; ll v0=={"abABeCghijklmnop",16} 


e const valarray 的 valarray<size_t> (索引 集合 ): 


valarray<T> operator[](const valarray<size_t>&) const; // 元素 引 用 

I... 

const valarray<char> v0 {"abcdefghijkimnop",16}; 

const size_t vi[l] {7, 5, 2, 3, 8}; 

valarray<char> v1 {vO[valarray<size_t>(vi,5)]); ll v1l=={"hfedi",5} 


e 非 const valarray 的 valarray<size_t> (索引 集合 ): 


indirect_array<T> operator[](const valarray<size_t>&); // 元 素 引 用 
Hs 
valarray<char> v0 {"abcdefghijkimnop",16}; 
valarray<char> v1 {"ABCDE",5); 
const size_t vi[] {7, 5, 2, 3, 8}; 
vO[valarray<size_t>(vi,5)] {v1}; ll v0=={f"abCDeBgAEjklmnop",16} 
注意 ， 掩 码 下 标 操 作 (valarray<bool>) 生成 一 个 mask_array， 索 引 集 合 下 标 操 作 


(valarray<size_t>) 生成 一 个 indirect_array。 


40.5.3 ”运算 
valarray 的 目标 是 支持 计算 ， 因 此 它 直 接 支持 很 多 基本 数值 运算 : 


valarray<T> 成 员 操 作 (iso.26.6.2.8 ) 








va.swap(va2) 交换 va 和 va2 的 元 素 ; 不 抛 出 异常 
n=va.size() n 为 va 的 元 素数 

t=va.sum() t 为 va 的 元 素 之 和 ， 用 += 计算 
t=va.min() t 为 va 的 最 小 元 素 ， 用 < 比较 
t=va.max() t 为 va 的 最 大 元 素 ， 用 < 比较 
va2=va.shift(n) 元 素 线性 左 移 

va2=va.cshift(n) 元 素 循 环 左 移 

va2=va.apply(f) 应 用 f: 每 个 元 素 va2[i] 的 值 为 f(vali]) 
va.resize(n,t) 今 va 为 n 个 元 素 的 valarray， 元 素 值 为 t 
va.resize(n) va.resize(n,T{}) 





valarray 不 支持 范围 检查 : 试图 访问 空 valarray 的 元 素 的 函数 的 效果 是 未 定义 的 。 
注意 ，resize() 不 保留 任何 旧 值 。 


262 第 四 部分 次 习 





valarray<T> 运算 (iso.26.6.2.6，iso.26.6.2.7) 
Vv 或 v2 可 以 是 标量 ,但 不 能 都 是 ; 用 于 算术 运算 ,结果 是 valarray<T> 











swap(va,va2) va.swap(va2) 

va3=va@va2 对 va 和 va2 的 元 素 执 行 @， 生 成 va3 ; @ 可 以 是 +、-、*、/、%、&、|、^、<<、>>、 
&&、 || 

vb=v@v2 对 v 和 v2 的 元 素 执 行 @， 生 成 一 个 valarray<bool>; @ 可 以 是 ==、!=、<、<=、> 、>= 

v2=@!(v) 对 v 的 元 素 执行 @， 生 成 v2; @ 可 以 是 abs、acos、asin、atan、cos、cosh、exp、 
log、 log10 

v3=atan2(v,v2) 对 v 和 v2 的 元 素 执 行 atan2() 

v3=pow(v,v2) 对 v 和 v2 的 元 素 执行 pow() 

p=begin(v) p 为 一 个 随机 访问 迭代 器 ， 指 向 v 的 第 一 个 元 素 

p=end(v) p 为 一 个 随机 访问 迭代 器 ， 指 向 v 的 尾 元 素 之 后 的 位 置 


二 元 运算 都 定义 了 针对 两 个 valarray 的 版 本 和 针对 一 个 valarray 及 其 标量 类 型 的 版 本 。 标 
量 类 型 被 处 理 为 一 个 具有 恰当 长 度 且 每 个 元 素 都 是 该 标量 类 型 的 valarray。 例 如 : 


void f(valarray<double>& v, valarray<double>& v2, double 由 





{ 
valarray<double> v3 = Viv2; ”14 对 所 有 i，v3[i] = v[i]j*v2[j] 
valarray<double> v4 = v*d; 吓 对 所 有 i， v4[i] = v[i]*d 
valarray<double> v5 = dx*v2; /| 对 所 有 i, v5[i] = d*v2[i] 
valarray<double> v6 = cos(V); // 对 所 有 i，v6[i] = cos(v[i]) 

} 


这 pe 量 运 算 都 对 其 运算 对 象 中 的 每 个 元 素 进行 计算 ,就 像 例子 中 的 * 和 cos 那样。 自然 ， 

有 当 标 量 类 型 定义 了 对 应 运算 时 才能 对 向 量 进行 此 运算 。 否 则 ， 编 译 器 会 在 尝试 特例 化 运 
算 符 或 函数 时 A 一 条 错误 消息 。 

当 运 算 结果 是 一 个 valarray 时 ， 其 长 度 与 运算 对 象 valarray 的 长 度 一 样 。 如 果 两 个 运 
算 对 象 的 长 度 不 _ 样 则 二 元 运算 的 结果 是 未 定义 的 。 

这 些 valarray 运算 都 返回 新 的 valarray 而 不 是 修改 其 运算 对 象 。 这 可 能 导致 较 高 代价 ， 
但 车 采取 积极 的 优化 技术 可 能 可 以 避免 这 种 高 代价 。 

例如 ， 如 果 v 是 一 个 valarray， 可 以 做 v*=0.2 和 v/=1.3 这 样 的 缩放 。 即 ， 对 向 量 应 用 

个 标量 意味 着 对 向 量 的 每 个 元 素 应 用 此 标量 。 照 例 ，*= 比 * 和 = 的 组 合 更 简洁 ( 见 18.3.1 
节 ) 也 更 易于 优化 ， 

注意 ， 非 赋值 运算 会 构造 一 个 新 valarray。 例 如 : 


double incr(double d) {return d+1; } 


void ffvalarray<double>& v) 


valarray<double> v2 = vapply(incr); 儿 生成 说 增 的 valarray 
1 

} 
此 代码 不 改变 v 的 值 。 但 不 幸 的 是 , apply() 不 接受 函数 对 象 ( 见 3.4.3 节 和 11.4 节 ) 为 其 参数 。 

逻辑 和 循环 移 位 函数 ，shift() 和 cshift()， 返 回 一 个 元 素 已 恰当 移 位 的 新 valarray， 
而 保持 旧 valarray 不 变 例如， 循环 移 位 v2=v.cshift(n) 生 成 一 个 valarray 其 中 
v2[i]==v[(it+n)%v.siz e()]。 逻 辑 移 位 v3=v.shift(n) 生成 一 个 valarray， 其 中 当 itn 是 v 的 一 
个 合法 索引 时 v3 上 i 等 于 v[itn]， 否 则 结果 是 一 个 默认 元 素 值 。 这 意味 着 shift() 和 cshift() 都 
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能 做 到 对 给 定 正 数 实 参 向 左 移 ， 对 给 定 负数 实 参 向 右 移 。 例 如 : 


void f() 

{ 
int alpha0] = { 1, 2, 3, 4, 5 ,6, 7, 8 }; 
valarray<int> v(alpha,8); ,2.343678 
valarray<int> v2 = v.shift(2); // 3, 4, 5, 6, 7, 8, 0,0 
valarray<int> v3 = V<<2; 11 4, 8, 12, 16, 20, 24, 28, 32 
valarray<int> v4 = v.shift(-2); 1/ 0, 0, 1, 2, 3, 4, 5, 6 
valarray<int> v5 = v>>2; /1 0, 0, 0, 1, 1, 1, 1,2 
valarray<int> v6 = v.cshift(2); 3,.4,36,7.8, .1,2 
valarray<int> v7 = v.cshift(~2); /1 7, 8, 1, 2, 3, 4, 5,6 


} 


对 valarray 而 言 ，>> 和 << 是 二 进 制 移 位 运算 符 ， 而 不 是 元 素 移 位 运算 符 或 1/O 运算 符 。 因 
此 ，<<= 和 >>= 可 用 来 对 整 型 元 素 进行 移 位 。 例 如 : 


void f(valarray<int> vi, valarray<double> vd) 


: vi <<= 2; 儿 对 vi 的 所 有 元 素 ，vi[i]<<=2 
vd <<= 2; /错误 : 浮 点 值 未 定义 移 位 操作 
} 
valarray 上 的 所 有 运算 符 和 数学 函数 也 都 可 以 应 用 于 slice_array ( 见 40.5.5 gslice_ 
array ( 见 40.5.6 节 )、mask_array ( 见 40.5.2 节 )、indirect array ( 见 40.5.2 节 ) 以 及 站 
些 类 型 的 组 合 。 但 是 ， 具 体 C++ 实现 可 以 选择 将 一 个 非 valarray 运算 对 象 转换 为 一 
valarray 后 再 进行 所 要 求 的 运算 。 


40.5.4 切片 


slice 是 一 种 抽象 ， 人 允许 我 们 像 处 理 一 个 任意 维度 的 矩阵 那样 处 理 一 个 一 维 数组 (如 内 
置 数组 、vector 或 valarray)。 它 是 Fortran 向 量 和 BLAS 库 (基本 线性 代数 因数 库 ，Basic 
Linear Algebra Subprograms) 的 关键 概念 ， 也 是 很 多 数值 计算 的 基础 。 基 本 上 ， 一 个 slice 
就 是 数组 某 个 局 部 中 间隔 为 n 的 元 素 : 
class std::slice { 
// 起 始 索引 、 长 度 和 跨 距 
public: 


slice(); Hl slice{0,0,0} 
slice(size t start, size t size, size t stride); 


size_t start() const; 儿 首 元 素 索引 
size_t size() const; /元 素数 
size_t stride() const; 儿 第 nm 个 元 素 位 于 start()+n*stride() 


跨 距 (stride) 是 slice 中 两 个 元 素 间 的 距离 ( 按 元 素数 衡量 )。 因 此 ， 一 个 slice 本 质 上 描述 

一 个 非 负 整数 到 索引 的 映射 。 元 素数 ( size()) 不 会 影响 映射 ( 寻 址 )， 但 能 让 我 们 找到 序 
列 尾 。 这 种 映射 可 用 来 在 一 维 数组 (如 valarray) 中 模拟 二 维 数组 ， 而 且 是 一 种 高 效 、 通 用 
且 相 当 方 便 的 方法 。 考 虑 一 个 3*4 的 矩阵 (三 行 四 列 元 素 ): 


valarray<int> v { 


{00,01,02,03}, / 行 0 
{10,11,12,13}, // 行 1 
{20,21,22,23} / 行 2 


}; 
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此 算 阵 可 图 示 如 下 : 





00101|102103 
10111|12|13 
20|21|22123 


























遵循 通常 的 C/C++ 规范， 此 valarray 在 内 存 中 的 布局 是 行 元 素 优先 〈 行 主 次 序 ，row-major 
order) 且 连 续 存 放 的 : 
for (int x : v) cout << x <<""'; 
会 输出 : 
0 1231011121320212223 
内 存 布局 可 图 示 如 下 : 
行 : 0 4 8 


oolo1lo2|03|10|11|12|13|20|21[22[23 
列 0 1 2 3 









































第 x 行 可 用 slice(x*4,4,1) 描述 。 即 ， 第 x 行 的 首 元 素 是 向 量 的 第 x*4 个 元 素 ， 行 中 下 一 个 
元 素 是 第 (x*4+1) 个 元 素 ， 以 此 类 推 ， 每 行 共有 4 个 元 素 。 例 如 ，slice{0,4,1} 描述 的 是 v 
的 第 一 行 ( 行 0): 00、01、02、03，slice{4,4,1} 描述 的 是 第 二 行 ( 行 1)。 

第 y 列 可 用 slice(y,3,4) 描述 。 即 ， 第 y 列 的 首 元 素 是 向 量 的 第 y 个 元 素 ， 列 中 下 一 个 
元 素 是 第 (y+4) 个 元 素 ， 以 此 类 推 ， 每 列 共 有 3 个 元 素 。 例 如 ，slice{0,3,4} 描述 的 是 第 一 
列 ( 列 0): 00、10、20，slice{1,3,4} 描述 的 是 第 二 列 ( 列 1)。 

除了 模拟 二 维 数组 外 ，slice 还 可 描述 很 多 其 他 序列 。 它 是 一 种 描述 简单 序列 的 非常 通 
用 的 方法 。 这 一 概念 在 40.5.6 节 中 会 进一步 讨论 。 

我 可 以 将 切片 理解 为 一 种 有 些 古 怪 的 迭代 器 : slice 令 我 们 能 描述 一 个 valarray 的 索引 
序列 。 我 们 可 以 基于 此 构建 一 个 STL 风格 的 迭代 器 : 


template<typename T> 
class Slice iter { 
valarray<T> Vi 
slice s; 
size tcurr; ”// 当前 元 素 索 引 





T& ref(size ti) const { return (*v){s.start()+i:s.stride()]; } 
public: 
Slice iter(valarray<T>* vv, slice ss, size_t pos =0) 
:v{vv}, s{ss}, curr{0} { } 


Slice_iter end() const { return {this,s,s.size()}; } 


Slice_iter& operator++() { ++curr; return *this; } 
Slice_iter operator++(int) { Slice_iter t = *this; ++curr; return t; } 


T& operator[](size_ti) { return ref(i); } IC 风格 下 标 
T& operator()(size ti) {return ref(i); } 咱 Fortran 风格 下 标 
T& operator:*() { return ref(curr); } 外 当前 元 素 


bool operator==(const Slice_iter& q) const 
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: return curr==q.Curr && s.stride()==q.s.stride() && s.start()==q.s.start(); 
- operator!=(const Slice_iter& q ) const 

l return !(*this==q); 

} 

bool operator<(const Slice_iter& q) const 

, return curr<q.curr && s.stride()==q.s.stride() && s.start()==q.s.start(); 
} 


下 
由 于 slice 保存 自身 大 小 ,我们 甚至 可 以 提供 范围 检查 。 在 本 例 中 ， 我 已 利用 slice::size() 
的 优点 来 提供 获取 slice 的 尾 后 位 置 的 end() 操作 。 

由 于 slice 既 可 描述 行 也 可 描述 列 ， 因 此 Slice_iter 允许 我 们 按 行 或 列 遍 历 valarray。 


40.5.5 Sslice_ array 


从 一 个 valarray 和 一 个 slice， 我们 可 以 创建 看 起 来 和 用 起 来 很 像 valarray 的 实体 ， 但 
实际 上 是 一 种 引用 切片 所 描述 的 数组 子 集 的 简单 方法 。 


slice_array<T> (iso.26.6.5 ) 
slice_array sa {sa2}; 拷贝 构造 函数 ， sa 与 sa2 指向 相同 的 元 素 


sa2=sa 将 sali] 指向 的 元 素 赋予 sa2[i] 指向 的 对 应 元 素 

sa=va 将 vali] 赋予 sali] 指向 的 对 应 元 素 

sa=v 将 v 赋予 sa 指向 的 对 应 元 素 

sa@=va 对 sa 指向 的 每 个 元 素 执行 sali]@=vali]; @ 可 以 是 /、 %、+、-、^、&、|、<< 或 >> 


用 户 无 法 直接 创建 slice_array。 取 而 代 之 ， 用 户 对 一 个 valarray 进行 下 标 操作 来 为 给 定 切 
片 创建 一 个 slice_array。 一 旦 slice_array 初始 化 完毕 ， 所 有 指向 它 的 引用 都 间接 指向 创建 
它 时 使 用 的 valarray。 例 如 ， 我 们 可 以 像 下 面 这样 创 建 表示 数组 中 间隔 元 素 的 对 象 : 


void f(valarray<double>& d) 


{ 
slice_array<double>& v_even = dfsiice(0,d.size()/2+d.size()%2,2)]; 
slice_array<double>& v_odd = df[slice(1,d.size()/2,2)]; 
Vv_even *=V_odd; /将 元 素 对 相 乘 ， 将 结果 保存 在 偶数 元 素 中 
v_odd = 0; 川 将 d 的 奇数 元 素 都 赋值 为 0 

} 


slice_array 可 以 拷贝 。 例 如 : 


slice_array<double> row(valarray<double>& d, int i) 


{ 
slice_array<double> v = d[slice(0,2,d.size()/2)]; 
Ws 
return df[slice(i%2,i,d.size()/2)]; 
} 
40.5.6 推广 切片 


slice ( 见 29.2.2 节 和 40.5.4 节 ) 可 以 描述 n 维 数组 的 行 或 列 。 但 是 ， 有 时 我 们 需要 抽取 
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并 非 行 或 列 的 子 数组 。 例如， 我 们 可 能 希望 抽取 一 个 4*3 矩阵 左上 角 的 3*2 的 子 和 矩阵 ， 
oololloz 
10|11l|12 
20|21|22 
30|31|32| 





























不 幸 的 是 ， 这 些 元 素 在 内 存 中 布局 无 法 用 单一 slice 描述 : 


子 数组 : 0 1 六 于 4 5 
01]02]1o|11|12]20j21|22|30[3 








SS 
SS 








a 





32 





gslice 是 “推广 切片 "， 包 含 来 自 n 个 slice 的 信息 : 
class std::gslice { 
1/ gslice 不 像 slice 那样 保存 1 个 跨 距 和 1 个 大 小 ， 而 是 保存 nn 个 跨 距 和 n 个 大 小 
public: 
gslice(); 
gslice(size_t sz, const valarray<size_t>& lengths, const valarray<size t>& strides); 


size_t start() const; /| 首 元 素 索引 
valarray<size_t> size() const; 咱 每 一 维 元 素数 
valarray<size_t> stride() const; // index[0], index[1],… 的 跨 距 


尖 


比 slice 多 出 的 值 令 gslice 可 以 定义 nm 个 整数 与 数组 索引 间 的 映射 。 例 如 ， 我 们 可 以 用 一 对 
(长 度 ， 跨 距 ) 描述 上 述 3*2 子 矩 阵 的 布局 : 
size_t gslice_index(const gslice& s, size_ ti, size_tj) /W/ 将 (ij) 映射 为 对 应 的 索引 


{ 
return s.start()+i*s.stride()[0]+tjxss,.stride()[1]; 


} 
valarray<size_t> lengths {2,3};// 第 一 维 2 个 元 素 ， 第 二 维 3 个 元 素 
valarray<size_t> strides {3,1}; // 第 一 维 索引 的 跨 距 为 3， 第 二 维 索 引 的 跨 距 为 1 


void f() 
{ 


gslice s(0,lengths,strides); 


for (int i=0; i<3; ++i) 儿 每 行 
for (int j=0; j<2; ++j) // 行 中 每 个 元 素 
cout <<"(" <<i<<"," <<]j <<")->" << gslice index(sS,ij) <<";"; /打印 映射 
} 
此 程序 会 输出 : 
(0,0)->0; (0,1)->1; (10)->3; (11)->4; (2,0)->6; (2,1)->7 


这 样 ， 包 含 两 对 (长 度 ， 览 距 ) 的 gslice 即 可 描述 一 个 二 维 数组 的 子 数组 ， 包 含 三 对 (长 度 ， 
， 跨 距 ) 的 gslice 即 可 描述 一 个 三 维 数组 的 子 数组 ， 以 此 类 推 。 使 用 gslice 作为 valarray 的 
索引 即 可 生成 一 个 gslice_array， 包 含 gslice 所 描述 的 元 素 。 例 如 : 


void f(valarray<float>& v) 


‘ 
gslice m(0,lengths, strides); 
viIm] = 0; /将 0 赋予 v[0],v[1],v[3],v[4],v[6],v[7] 
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gslice_array 提供 了 与 slice_array 相同 的 成 员 ( 见 40.5.5 节 )。gslice_array 是 将 gslice 用 
作 valarray 下 标 得 到 的 结果 ( 见 40.5.2 节 )。 


40.6 推广 数值 算法 


在 <numeric> 中 ， 标 准 库 提 供 了 一 些 推广 的 数值 算法 ， 其 风格 类 似 <algorithm> 中 的 
非 数值 算法 ( 见 第 32 章 )。 这 些 算法 提供 了 通用 版 本 ， 对 数值 序列 进行 常见 运算 : 


x=accumulate(b,e,i) 
x=accumulate(b,e,i,f) 


x=inner_product(b,e,b2,i) 


x=inner_product(b,e,b2,i,f,f2) 
p=partial_sum(b,e,out) 
p=partial_sum(b,e,out,f) 
p=adjacent difference(b,e,out) 
p=adjacent_difference(b,e,out,f) 


iota(b,e,v) 


数值 算法 (iso.26.7 ) 
这 些 算法 接受 输入 友人 代 器 

x 为 i 与 [b:e) 中 元 素 的 和 

使 用 f 而 不 是 + 进行 累加 

x 为 [b:e) 和 [b2:b2+(e-b)) 的 内 积 ， 即 , i 与 [b:e) 中 每 个 p1 和 
[b2:b2+(e-b)) 中 对 应 p2 的 (*p1)*(*p2) 之 和 

用 f 和 人 2 代 替 + 和 * 计 算 内 积 

[out:p) 中 第 i 个 元 素 为 [b:b+i) 间 元 素 之 和 

用 ff 代替 + 计算 部 分 和 

[out:p) 中 第 i 个 元 素 为 (*b+i)-*(b+i-1)，i>0; 若 e-b>0， 则 *out 为 *b 

用 f 代 替 + 计算 邻接 差 

将 [b:e) 中 每 个 元 素 赋值 为 ++v; 因此 序列 变 为 v+1、v+2、… 





这 些 算法 推广 了 求 和 这 样 的 常见 运算 ,将 它们 应 用 于 各 种 序列 并 将 施用 于 序列 元 素 的 运算 作 
为 参数 。 对 每 个 算法 ,标准 库 都 在 通用 版 本 之 外 提供 了 应 用 最 常用 运算 符 的 版 本 。 


40.6.1 accumulate() 


accumulate() 的 简单 版 本 累加 序列 中 的 元 素 , 使 用 的 是 + 运算 符 : 


template<typename In, typename T> 


T accumulatel(In first, In last, T init) 


for (; first!=last; ++first) // 对 [first:last) 中 的 所 有 元 素 


init = init + *first; 
return init; 


} 


我 们 可 以 像 下 面 这 样 使 用 accumulate(): 


void f(vector<int>& price, list<float>& incr) 


{ 
int i = accumulate(price.begin(),price.end(),0); 儿 票 加 于 int 中 
double d = 0; 
d= accumulate(incrbegin(),incrend(),d); /| 累加 于 double 中 
int prod = accumulate(price.begin,price.end(),1,0(int a, int b) { return a*b; }); 
11 
} 


传递 来 的 初 值 的 类 型 决定 了 返回 类 型 。 
我 们 可 以 传递 给 accumulate() 一 个 初始 值 和 一 个 “组 合 元 素 ” 的 操作 ， 因 此 
accumulate() 并 非 总 是 进行 加 法 运算 。 


268 荔 四 亏 分 村 准 说 





从 一 个 数据 结构 中 抽取 值 的 操作 是 accumulate() 的 最 常见 的 操作 。 例 如 : 
struct Record { 

Wh 

int unit_price; 

int number_of_units; 


es price(llong val, const Record& r) 

return val + r.unit_price * r.number_of_units; 

} 

void f(const vector<Record>& v) 

: cout << "Total value: ”<< accumulate(v.begin(),v.end(),0,price) << "\n'; 
} 


在 某 些 社区 中 ， 类 似 accumulate 的 操作 被 称 为 reduce 、reduction 和 fold。 


40.6.2 inner_product() 
累加 一 个 序列 非常 常见 ， 而 累加 一 对 序列 也 并 不 罕见 : 


template<typename In, typename In2, typename T> 
T inner_product(In first, in last, Iin2 first2, T init) 


{ 
while (first != last) 
init = init + x*first++ * *first2++; 
return init; 
} 


template<typename In, typename In2, typename T, typename BinOp, typename BinOp2> 
T inner_product(In first, In last, In2 first2, T init, BinOp op, BinOp2 op2) 
{ 
while (first != last) 
init = op(init,op2(*first++,*first2++)); 
return init; 


} 
照例 ， 只 需 传 递 第 二 个 输入 序列 的 起 始 位 置 作为 参数 。 第 二 个 输入 序列 应 该 至 少 
列 一 样 长 。 

inner_product() 是 Matrix 与 valarray 相 乘 的 关键 操作 : 


valarray<double> operator*(const Matrix& m, valarray<double>& v) 


{ 


valarray<double> res(m.dim2()); 


for (size_ti= 0; i<m.dim2(); i++){ 

auto& ri = m.row(i); 

res[i] = inner_product(ri,ri.end(),&v[0],double(0)); 
} 


return res; 
} 


valarray<double> operator*(valarray<double>& v const Matrix& m) 


{ 


valarray<double> res(m.dim1()); 


for (size ti=0; i<m.dim1(); it+) { 
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auto& ci = m.column(i); 
res[i] = inner_product(ci,ci.end(),&v[0],double(0)); 
} 


return res; 


} 
inner_product 的 某 些 形式 也 称 为 “点 积 ”。 
40.6.3 partial_sum() 和 adjacent_difference() 
算法 partial_sum() 和 adjacent_difference() 是 互 逆 的 ， 它 们 处 理 增 量 变化 的 概念 。 
给 定 一 个 序列 a,，b，c，d，…，adjacent_difference() 会 生成 a,，b-a,，c-b，d-c，…。 
考虑 一 个 温度 读数 向 量 。 我 们 可 以 将 其 转换 为 温度 变化 的 向 量 : 
vector<double> temps; 


void f() 
{ 


} 
例如 ，17，19，20，20，17 转换 为 17，2，1，0，-3。 
与 之 相反 ，partial _sum() 可 以 计算 一 组 增 量变 化 的 最 终结 果 : 


template<typename In, typename Out, typename BinOp> 
Out partial_sum(in first, in last, Out res, BinOp op) 
{ 


adjacent_difference(temps.begin(),temps.end(),temps.begin()); 


if (first==last) return res; 

*res = +*first; 

T val = *first; 

while (++first != last) { 
val = op(val,*first); 
*++res = val; 

} 


return ++res; 


} 


template<typename In, typename Out> 
Out partial _sum(ln first, In last, Out res) 


{ 


} 
给 定 一 个 序列 a、b、c、d, …， partial_sum() 会 生成 a、a+b、a+btc、a+b+c+d,…。 例 如 : 


void f() 
{ 


return partial_sum(first,last,res,plus); ”// 使 用 std::plus ( 见 33.4 节 ) 


partial_sum(temps.begin(),temps.end(),temps.begin()); 
} 


注意 partial_sum() 先 递增 res 再 赋予 它 一 个 新 值 的 方式 ， 这 使 得 res 可 以 与 输入 序列 是 同 
一 个 序列 ; adjacent_difference() 也 有 类 似 特性 。 因 此 ， 

partial_sum(v.begin(),v.end(),v.begin()); 
将 序列 a，b，c，d 转换 为 a，a+b，a+b+c，a+b+c+d， 再 执行 


adjacent_difference(vbegin(),vend(),vbegin()); 
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会 重 现 原始 值 ， 反 之 亦 然 。 因 此 ， 对 本 节 开 始 的 例子 使 用 partial_sum(), 会 将 17，2，1， 
0，-3 转换 为 17，19，20，20，17。 

一 些 人 认为 温度 差 只 是 气象 学 或 科学 实验 的 无 聊 细节 ， 我 注意 到 分 析 股 票 价格 或 海平 面 
的 变化 会 更 多 地 吸引 他 们 的 注意 力 ， 而 其 中 涉及 的 操作 完全 相同 。 这 两 个 操作 对 分 析 任 何 变 
化 序列 都 是 很 有 用 的 。 


40.6.4 iotal() 
调用 iota(b,e,n) 将 n+i 赋予 [b:e) 的 第 i 个 元 素 。 例 如 : 


vector<int> v(5); 
iotalv.begin(),vend(),50); 
vector<int> v2 {50,51,52,53,54} 


if (vi!=v2) 
error("complain to your library vendor"); 
名 字 iota 是 希腊 字母 。 的 拉丁 拼写 ， 曾 用 于 命名 APL 语言 中 的 类 似 函 数 。 
注意 ， 不 要 混淆 iota() 和 非 标 准 但 很 常用 的 itoa() (int-to-alpha， 整 数 转换 为 字符 串 ; 
风 12.2.4 节 )。 


40.7 ”随机 数 


随机 数 对 很 多 应 用 都 很 重要 ， 如 仿真 、 游 戏 、 基 于 采样 的 算法 、 加 密 以 及 测试 。 例 如 ， 
我 们 可 能 希望 为 一 个 路 由 器 仿真 程序 选择 TCP/IP 地 址 、 决 定 一 只 怪兽 是 发 起 攻击 还 是 挠 挠 
头 而 已 以 及 生成 一 组 值 来 测试 一 个 平方 根 函 数 。 在 <random> 中 ， 标 准 库 定义 了 生成 〈 伪 ) 
随机 数 的 特性 。 这 种 随机 数 是 按照 数学 公式 生成 的 值 的 序列 ， 而 不 是 无 法 猜测 (“ 真 随机 ”) 
的 数 ， 后 者 可 以 从 物理 过 程 中 获得 ， 例 如 放射 性 衰变 或 太阳 辐射 。 如 果 具 体 实现 具备 这 种 真 
随机 设备 ， 会 将 其 表示 为 一 个 random_device ( 见 40.7.1 节 )。 

标准 库 提供 了 四 种 随机 数 相 关 的 实体 : 

@ 均匀 随机 数 发 生 器 (uniform random number generator) 是 一 个 返回 无 符号 整数 值 的 函 
数 对 象 ， 值 域 中 每 个 可 能 值 (理想 情况 下 ) 被 返回 的 概率 相等 。 
随机 数 引 擎 (random number engine， 简 称 引 擎 ) 是 一 个 均匀 随机 数 发 生 器 ， 可 用 默 
认 状 态 创建 一 一 E{}， 或 用 一 个 seed 确定 的 状态 创建 一 一 E{s}。 
随机 数 引 擎 适配器 (random number engine adaptor， 简 称 适配器 ) 是 一 个 随机 数 引 警 ， 
它 接受 某 个 其 他 随机 数 引 擎 生成 的 值 ， 并 应 用 算法 将 这 些 值 转换 为 男 一 个 具有 不 同 
随机 特性 的 值 的 序列 。 
随机 数 分 布 (random number distribution ， 简 称 分 布 ) 是 一 个 函数 对 象 ， 其 返回 值 的 
分 布 服从 一 个 关联 的 数学 概率 密度 函数 p(z) 或 一 个 关联 的 离散 概率 函数 P(zi)。 
更 多 细节 请 见 iso.26.5.1。 

符合 用 户 习惯 的 更 简单 的 描述 是 ， 一 个 随机 数 发 生 器 就 是 一 个 引擎 加 一 个 分 布 。 引 擎 生 
成 一 个 均匀 分 布 的 值 的 序列 ， 分 布 再 将 这 些 值 转换 为 要 求 的 形状 (分布 )。 即 ， 如 果 你 从 随 
机 数 发 生 器 接受 了 大 量 数值 并 绘制 它们 ， 就 会 得 到 一 个 描绘 它们 分 布 的 相当 平滑 的 图 形 。 例 
如 ， 将 normal_distribution 绑 定 到 default_random_engine 会 提供 给 我 们 一 个 生成 正 态 分 
布 的 随机 数 发 生 器 : 
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auto gen = bind(normal_distribution<double>{15,4.0},default_random_engine{}); 


for (int i=0; i<500; ++i) cout << gen(); 


标准 库 函 数 bind() 创建 一 个 函数 对 象 ， 对 其 第 二 个 实 参 调用 第 一 个 实 参 ( 见 33.5.1 节 )。 
如 果 使 用 ASCII 字符 图 形 ( 见 5.6.3 节 )， 我 会 得 到 : 


六 六 


EE 


六 冰冰 六 玉 


玉米 米 六 


六 六 六 六 


六 六 六 六 六 六 


六 六 六 闵 率 米 闪 六 六 六 六 六 





来 水 水 永 永 玉米 来 炒 束 来 束 来 天 求 玉 来 永 米 永 永 求 永 求 末末 本 

六 六 六 党 米 闵 宗 米 站 米 补 洲 闵 闲 冰 来 闵 玉 闵 冰冰 六 六 闲 六 来 率 

六 六 六 洲 六 六 六 六 六 玉米 六 六 六 闵 玉 来 米 六 六 次 六 玉米 案 玉 来 六 米 来 玉 闵 玉米 六 玉 闵 六 

率 米 率 六 洲 闵 六 冰 六 闪 米 率 六 六 六 米 闵 来 闵 床 六 六 六 六 率 闵 宁 闵 玉 闵 米 六 六 六 六 六 玉米 闵 闵 六 六 六 水 六 六 来 宁 六 洲 米 闵 素 闵 冰 六 来 


六 六 米 率 玉 床 闵 六 率 玉 玉 闲 玉 闲 冰 素来 浆 永 冰 水 闲 冰 率 来 闵 宁 玉米 永 闵 玉米 六 冰冰 六 六 来 玉 术 玉米 闵 闵 米 兴 站 六 六 米 





六 闵 宁 闵 兴 六 六 六 六 玉米 来 闵 闵 闵 玉 闵 玉米 率 闵 冰 闵 闵 率 六 站 守 六 床 六 六 六 冰冰 冰冰 率 六 永 术 永宁 来 兴 六 六 床 六 冰 玉 六 闵 六 六 
六 六 率 六 米 闪 六 宋 闵 米 守 来 来 六 六 六 六 闵 宁 六 六 六 六 玉米 米 闵 闵 玉 来 玉 

米 闵 叶 宁 六 米 六 玉米 玉 六 六 六 六 六 六 六 六 闵 来 六 宁 米 末 玉 六 来 来 玉米 玉 六 玉 闵 率 闵 六 玉米 宁 闵 六 六 六 浆 米 玉米 六 六 

六 六 党 六 六 米 闵 闵 冰 六 冰冰 浆 冰 术 闵 米 闪 六 闲 六 六 六 六 六 来 闵 六 六 六 米 闵 玉 本 六 米 

浆 六 六 六 六 六 六 冰冰 六 来 六 闲 闵 订 六 六 亲 闵 率 玉 六 六 玉 术 水 冰 闵 冰冰 玉林 六 


六 认 六 六 





六 六 六 闵 闵 永 六 闵 率 
米 闵 窜 玉 六 六 六 订 冰 六 本 六 

六 六 六 六 六 来 六 来 六 冰冰 六 

六 玉米 玉 闪 冰 六 

六 六 水 六 六 

六 六 本 六 

扩 


六 


大 多 数 情 况 下 ， 大 多 数 程 序 员 只 需 一 个 给 定 范围 内 简单 的 均匀 分 布 整数 序列 或 浮 点 数 序 列 。 


例如 : 


void test() 


{ 


} 


Rand_int ri {10,20}; 外 [10:20] 内 均匀 分 布 的 int 
Rand_double rd {0,0.5}; /1/ [0:0.5) 内 均匀 分 布 的 double 


for (int i=0; i<100; ++i) 
cout << ri() << ”; 
for (int i=0; i<100; ++i) 
cout << rd() <<''; 


不 幸 的 是 ，Rand_int 和 Rand_double 不 是 标准 类 ， 但 很 容易 构造 它们 : 


class Rand_int { 


Rand_int(int Io, int hi) : p{lo,hi} {} /| 保存 参数 
int operator()() const { return r(); } 


private: 


上 


uniform_int_distribution<>::param_type p; 
autor= bind(uniform_int_distribution<>{p},default_random_engine{}); 


我 使 用 了 分 布 的 标准 param_type 别名 ( 见 40.7.3 节 ) 保存 参数 ， 从 而 就 可 以 用 auto 避免 命 
名 bind() 的 结果 。 
只 是 为 了 体现 变化 ， 我 使 用 不 同 技术 实现 Rand_double: 











class Rand_double { 
public: 
Rand_double(double low, double high) 
:r(bind(uniform_real_distribution<>(low,high),default_random_engine())) { } 
double operator()() { return r(); } 
private: 
function<double()> r; 
}; 
随机 数 的 一 个 重要 用 途 是 采样 算法 。 在 这 类 算法 中 ,我们 需要 从 一 个 很 大 的 群体 (population) 
中 选择 一 个 特定 大 小 的 样本 (sample)。 下 面 是 一 篇 历史 悠久 的 著名 论文 [Vitter, 1985] 中 的 算 
法 R (最 简单 的 算法 ): 
template<typename iter typename Size, typename Out, typename Gen> 
Out random_samplel(lter first, iter last, Out result, Size n, Gen&& gen) 
{ 


using Dist = uniform_int_distribution<Size>; 
using Param = typename Dist::param_type; 


川 填充 目标 存储 ， 并 将 first 向 前 推进 : 

copy(first,n,result); 

advance(first,n); 

/外 采样 [firsttn:last) 中 的 剩余 值 

/在 [0:k] 中 选取 一 个 随机 数 ， 若 r<n， 用 采样 值 替 换 它 。 

咱 每 步 迭代 会 递增 ， 使 得 每 个 值 的 选择 概率 变 小 

1/ 对 随机 访问 迭代 器 ，k =i-first (假定 我 们 递增 i， 但 不 递增 first)。 





Dist dist; 
for (Size k = n; first!=last; ++first,++k) { 
Sizer = dist(gen,Param{0,k}); 
if(r < n) 
*(result + r) = *first; 


} 


return result; 


} 


40.7.1 引擎 


一 个 均匀 随机 数 发 生 器 就 是 一 个 函数 对 象 ， 它 生成 一 个 接近 均匀 分 布 的 值 序列 ， 值 类 型 
为 引擎 的 result_type: 


均匀 随机 数 发 生 器 G<T>: (iso.26.5.1.3 ) 


Gi:result_ type 序列 元 素 的 类 型 

x=g() 应 用 运算 符 : x 是 序列 的 下 一 个 元 素 
x=G::min() x 是 g() 能 返回 的 最 小 元 素 
x=G::max() x 是 g() 能 返回 的 最 大 元 素 


一 个 随机 数 引擎 是 一 个 均匀 随机 数 发 生 器 加 上 一 些 额 外 特性 ， 从 而 有 更 广 的 用 途 : 


随机 数 引擎 E<T>: (iso.26.5.1.4 ) 
Ee f; 默认 构造 函数 
E e {e2}; 拷贝 构造 函数 
E e {s}; e 会 进入 种 子 s 所 确定 的 状态 
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( 续 ) 
随机 数 引 区 E<T>: (iso.26.5.1.4 ) 
E e {g}; e 会 进入 用 种 子 序列 g 调用 generate() 所 确定 的 状态 
e.seed() e 会 进入 默认 状态 
e.seed(S) e 会 进入 种 子 s 所 确定 的 状态 
e.seed(g) e 会 进入 用 种 子 序列 g 调用 generate() 所 确定 的 状态 
e.discard(n) 跳 过 序列 的 下 n 个 元 素 
==e2 e 和 e2 会 生成 完全 相同 的 序列 吗 ? 
el=e2 !(e==e2) 
os<<e 将 e 的 表示 形式 输出 到 os 
is>>e 从 is 读 取 引 擎 的 表示 形式 (之 前 由 << 输出 ),， 存 人 @ 


种 子 是 [0:2”) 范围 内 的 一 个 值 ， 可 用 来 初始 化 一 个 特定 的 引擎 。 种 子 序列 g 是 一 个 函数 对 象 ， 
提供 一 个 函数 g.generate(b,e)， 当 被 调用 时 会 将 新 生成 的 种 子 填 人 [b:e) 中 ( 见 iso.26.5.1.2 )。 


标准 随机 数 引擎 (iso.26.5.3 ) 


default_random_engine 广泛 适用 性 和 低 代价 的 引擎 的 别名 
linear_congruential_engine<Ul,a,c,m> Xi+l= (axit+ c) mod m 
mersenne_twister_engine<Ul,w,n,m,r,a,u,d,s,t,c,l,f> 见 iso.26.5.3.2 
Subtract_with_carry_engine<Ul,w,s,r> Xxin=(axi) modb， 其 中 b= m-m’+1， 


a=b-(b- 1)/m 


标准 随机 数 引 擎 的 参数 UI 必须 是 一 个 无 符号 整数 类 型 。 对 linear_congruential_engine<Ul,a,c,m>， 
若 模 数 m 为 0， 则 使 用 值 numeric limits<result_type>::max()+1。 人 例如， 下面 的 代码 输出 随机 数 第 
一 次 重复 的 位 置 : 

map<int,int> m; 

linear_congruential_engine<unsigned int,17,5,0> linc_eng; 

for (int i=0; i<1000000; ++i) 

if (1<++ml[linc_eng()]) cout << i << \n'; 

我 很 幸运 ， 参 数 不 是 很 糟糕 ， 并 未 得 到 重复 的 数值 。 你 可 以 尝试 <unsigned int,16,5,0>,， 并 
观察 差异 。 除 非 你 确实 需要 特殊 引擎 并 确切 了 解 你 在 做 什么 ， 否 则 选择 default_random_ 
engine。 

随机 数 引 擎 适配器 (random number engine adaptor) 接受 一 个 随机 数 引擎 作为 其 实 参 ， 
并 生成 一 个 具有 不 同 随机 特性 的 新 的 随机 数 引擎 。 


标准 随机 数 引擎 适配器 (iso.26.5.4 ) 





discard_block_engine<E,p,r> E 为 引擎 ， 见 iso.26.5.4.2 
independent_bits_engine<E,w,Ul> 生成 类 型 为 UI 的 w 位 的 数 ; 见 iso.26.5.4.3 
shuffle_order_engine<E,k> 见 iso.26.5.4.4 


例如 : 


independent_bits_engine<default_random_engine,4,unsigned int> ibe; 
for (int i=0; i<100; ++i) 
cout << '0'+ibe() << ”; 


这 段 代码 会 生成 100 在 [48:63] ([“0”:“0”+2%+1)) 范围 内 的 个 数 。 


274 和 淄 四 部 分 村 准 大 


标准 库 为 一 些 常用 引擎 定义 了 别名 : 
using minstd_rand0 = linear_congruential_engine<uint fast32_t, 16807, 0, 2147483647>; 
using minstd_rand = linear_congruential_engine<uint fast32 t, 48271, 0, 2147483647>; 
using mt19937 = mersenne_twister_engine<uint_fast32_t, 32,624,397, 
31,0x9908b0df， 
11,0xffffffff， 
7,0x9d2c5680， 
15,0xefc60000， 
18,1812433253> 
using mt19937_64 = mersenne twister engine<uint_fast64 ft, 64,312,156， 
31,0xb5026f5aa96619e9, 
29, 0x5555555555555555, 
17, 0x71d67fffeda60000， 
37, Oxfff7reee000000000, 
43, 6364136223846793005>; 
using ranlux24_ base = subtract with_ carry_engine<uint fast32 t, 24, 10, 24>; 
using ranlux48_base = subtract_with_carry_engine<uint fast64 t, 48, 5, 12>; 
using ranlux24 = discard_block engine<ranlux24_base, 223, 23>; 
using raniux48 = discard_block_ engine<ranlux48 base, 389, 11>; 
using knuth_b = shuffle_ order_ engine<minstd_rand0,256>; 


40.7.2 ”随机 设备 


如 果 一 个 实现 能 提供 真正 的 随机 数 发 生 器 ， 则 随机 数 源 以 一 个 称 为 random_device 的 
均匀 随机 数 发 生 器 的 形式 提供 : 


random_device (iso.26.5.6 ) 
random_device rd {s}; string s 标识 一 个 随机 数 源 ; 具体 实现 定义 的 ; 显 式 构造 函数 
d=rd.entropy() d 为 一 个 double; 对 一 个 伪 随 机 数 发 生 器 d==0.0 





我 们 可 以 将 s 看 作 一 个 随机 数 源 的 名 字 ， 例 如 一 个 盖 格 计数 器 、 一 个 Web 服务 或 一 个 包 
含 真正 随机 源 的 记录 的 文件 /设备 。 对 一 个 有 nn 个 状态 ,概率 分 别 为 Pp。，…，P 的 设备 ， 
entropy() 定义 为 
S(PosrsssPai)= a PlogP; 
i=0 

箭 是 对 生成 的 数 的 随机 性 和 不 可 预测 程度 的 一 种 估计 。 与 热力 学 不 同 ， 焙 越 高 表明 生成 的 随 
机 数 越 好 ， 因 为 这 意味 着 接 下 来 的 数 更 难 猜 测 。 这 个 公式 反映 了 重复 抛 一 个 完美 的 二 面 仍 子 
得 到 的 结果 。 

random_device 对 密码 学 应 用 很 有 用 ， 但 如 果 不 对 random_device 的 实现 做 认真 研究 
就 信任 它 ， 会 违反 这 类 应 用 的 基本 原则 。 


40.7.3 分 布 
一 个 随机 数 分 布 就 是 一 个 函数 对 象 ， 当 使 用 一 个 随机 数 发 生 器 实 参 调用 它 时 ,会 生成 一 
个 result_type 类 型 的 值 的 序列 : 


随机 数 分 布 D: (iso.26.5.1.6 ) 
D::result_type D 的 元 素 类 型 
D::param_type 构造 D 所 需 的 参数 集合 的 类 型 
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( 续 ) 
随机 数 分 布 D: (iso.26.5.1.6 ) 
Dd 1; 默认 构造 函数 
D d {p}; 从 param_type p 构造 
d.reset() 重 置 为 默认 状态 
p=d.param() p 为 d 的 param_type 类 型 的 参数 。 
d.param(p) 重 置 为 param_type p 所 确定 的 状态 
x=d(g) x 是 给 定 的 g 条 件 下 d 所 生成 的 值 
x=d(g,p) x 是 给 定 的 g 和 参数 p 的 条 件 下 d 所 生成 的 值 
x=d.min() x 是 d 能 返回 的 最 小 值 
x=d.max() x 是 d 能 返回 的 最 大 值 
d==d2 d 和 d2 会 生成 完全 相同 的 序列 吗 ? 
d!=d2 !(d==d2) 
os<<d 输出 d 的 状态 到 os， 使 之 能 被 >> 读 回 
is>>d 从 is 读 取 一 个 之 前 由 << 输出 的 状态 , 存 人 d 


在 下 表 中 ， 模 板 实 参 R 表示 数学 公式 中 需要 一 个 实数 且 double 为 默认 类 型 。| 表示 需要 一 
个 整数 而 int 为 默认 类 型 。 


均匀 分 布 (iso.26.5.8.2 ) 
分 布 前 提 条 件 默认 结 
uniform_int_distribution<l>(a,b) a<b (0, max) [a:b] 
Plila,b)= 1/(b -a+l) 





uniform_real_distribution<R>(a,b) a<b (0.0, 1.0) [a:b) 
p (xla, b)= 1/(b - a) 


前 提 条 件 (precondition) 域 指出 对 分 布 参 数 的 要 求 。 例 如 : 


uniform_int_distribution<int> uid1 {1,100}; /正确 
uniform_int_distribution<int> uid2 {100,1};  // 错 误 : a>b 


默认 (default) 域 指 出 默认 参数 。 例 如: 


uniform_real_distribution<double> urd1 1; 儿 使 用 a==0.0 和 b==1.0 
uniform_real_distribution<double> urd2 {10,20}; ”// 使 用 a==10.0 和 b==20.0 
uniform_real_distribution<> urd3 {}; 外 使 用 double 及 a 二 0.0 和 b==1 


结果 (result) 指出 结果 范围 。 例 如 : 


uniform_ int distribution<> uid3 {0,5}; 
default_ random_engine e; 
for (int i=0; i<20; ++i) 

cout << uid3(e) <<"'"; 


uniform_int_distribution 的 范围 是 封闭 的 ， 因 此 这 段 代 码 会 输出 6 种 可 能 值 : 
20254155011500503414 

uniform_real_distribution 与 其 他 浮 点 结果 的 分 布 类 似 ， 范 围 是 半 开 的 。 
伯 努 利 分 布 反映 了 不 同 负载 程度 下 投 硬 币 的 结果 : 





伯 努 利 分 布 (iso.26.5.8.3 ) 





分 布 前 提 条 件 默认 结果 
bernoulli_distribution(p) 0<=p<1 (0.5) {true, false} 
p if b = true 
P(blP) = 
(blp) | —p if b= false 
binomial_distribution<1>(t,p) 0<p<land0=<r (1, 0.5) [0: z ) 


Plilt, p) = (za 一 站) 


geometric_distribution<1l>(p) 0<P<1l (0.5) [0: om ) 
Plilp)= p(1—p) 
negative_binomial_distribution<1>(k,p) 0<p<land0<k (1, 0.5) [0: o ) 





k+i—l 2 
Pa p)=( : jzxa- 


泊 松 分 布 表 达 了 在 固定 范围 的 时 空 内 事件 发 生 给 定 次 数 的 概率 : 


泊 松 分 布 (iso.26.5.8.4 ) 











分 布 前 提 条 件 默认 结果 
poisson_distribution<|>(m) 0<m (1.0) [0: ~ ) 
esi 
Pd = 一“ 
2 
exponential_distribution<R>(lambda) 1 < lambda (1.0) (0: om ) 
PCxla) = he 和 
gamma_distribution<R,R>(alpha,beta) 0<aand0<p (1.0, 1.0) (0: o ) 
eB , 
Xxla,B)=—— x 
plxle,pB Fe 
weibull_distribution<R>(a,b) 0<aland0<b (1.0, 1.0) [0: ~ ) 
a-l a 
a(lx 
ce 人 人 on(()) 
extreme_value_distribution<R>(a,b) 0<b (0.0, 1.0) R 
1 要 一 天 a—x 
p(xla, b) ee 人 三 -em 人 本 ) 


正 态 分 布 将 实数 值 映射 到 实数 值 。 最 简单 的 就 是 著名 的 “贝尔 曲线 ”一 一 数值 对 称 地 分 布 在 
峰值 (均值 ) 周围 ， 元 素 距 均值 的 距离 由 一 个 标准 偏差 参数 控制 。 


正 态 分 布 (iso.26.5.8.5 ) 





分 布 前 提 条 件 默认 结果 
normal_distribution<R>(m,s) 0<s (0.0, 1.0) R 
1 x- 
p(xl4u, a) = 二 后 ep 7 ] 
lognormal_distribution<R>(m,s) 0<s (0.0, 1.0) >0 








od 1 ( a 
Xx|m,s 
” SXN2A ? 2s2 


chi_squared_distribution<R>(n) 0<n (1) >0 
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( 续 ) 
正 态 分 布 (iso.26.5.8.5 ) 
分 布 前 提 条 件 默认 结果 
x "21 ex/2 
PC = Fen)am 
cauchy_distribution<R>(a,b) 0<b (0.0, 1.0) R 
2 —] 
p(xla, b) = [ +(: ?] ) 
fisher_f_distribution<R>(m,n) 0<mand0<n (1.1) >=0 
_ Tl((m+n)/2) (mm 降 (m/2)-1 x ]” 
Plm, 7) = 区 mw7OFO) (2 ] Lh 
student_t_distribution<R>(n) 0<n (1) R 


1 T(n+1)2 EN 
pm- 是 ) oo 人 + 二 ] 


为 了 感受 一 下 这 些 分 布 ， 可 以 观察 不 同 参数 下 分 布 的 图 形 表示 。 这 种 图 形 很 容易 生成 ， 甚 至 
可 以 很 容易 地 在 互联 网 上 找到 。 
采样 分 布依 据 其 概率 密度 函数 PP 将 整数 映射 到 一 个 特定 范围 : 


分 布 (is0.26.5.8.6) 
分 布 前 提 条 件 默认 结果 
discrete distribution<lytbej 0<bl] 无 [0eb) 
PGlPo Pr-D= 户 
序列 [b:e) 提 供 了 权重 Www， 使 得 PrFwyS 且 0<S=wo+… 


+wn1， 其 中 n= e-b 
discrete distribution<l>(lst) discrete_distribution<1>(lst.begin(),lst.end()) 
discrete_distribution<l>(n,min,max,f) discrete_distribution<|>(b,e) 


其 中 [b:e) 的 第 i 个 元 素 计算 如 下 


f(min+i*(max-min)/n +(max-min)/(2*n)) 





piecewise_constant_distribution<R>{b,e,b2,e2} b[i]<b[i+1] 沪 [*b:*(e-1)) 
P(x|xo,** xn, po*** pn) 
piecewise_linear_distribution<R>{b,e ,b2,e2} b[ij<b[i+1] 无 [*b:*(e-1)) 
P(x|xo,*** xn, Po*** Pn) 
计 1 一 大 x—bi 
一 


bi < bi for all b; in [b:e) 
1 2-1! 
Pi= wi/S where S = 7 ZS + wini)(biri— bi) 


[b:e] 中 为 范围 边界 
[b2:e2] 中 为 权重 





40.7.4 C 风格 随机 数 
在 <cstdlib> 和 <stdlib.h> 中 ， 标 准 库 提 供 了 一 些 简单 的 特性 来 生成 随机 数 : 


#define RAND_MAX implementation_defined /* 最 大 可 能 整数 */ 


int rand(); /0 和 RAND MAX 间 的 伪 随 机 数 
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void srand(unsigned inti); 。 /将 随机 数 发 生 器 的 种 子 设置 为 i 


创建 一 个 好 的 随机 数 发 生 器 并 不 容易 ， 而 不 幸 的 是 并 非 所 有 系统 都 提供 了 一 个 好 的 rand()。 
特别 是 ， 随 机 数 的 低位 常常 生成 得 不 好 ， 因 此 rand()%n 并 不 是 一 种 生成 0 到 n-1 之 间 随 机 
数 的 好 的 可 移植 方法 。 而 int((double(rand())/RAND_MAX)*n) 通常 可 以 给 出 可 接受 的 结果 。 
但 是 ， 对 重要 的 程序 ， 基 于 uniform_int_distribution 的 生成 器 ( 见 40.7.3 节 ) 会 给 出 更 可 靠 
的 结果 。 

调用 srand(s) 用 种 子 (seed) s (作为 参数 提供 ) 开始 一 个 新 的 随机 数 序列 。 为 了 方便 调 
试 , 一 个 给 定 种 子 生成 固定 的 序列 通常 很 重要 。 但 是 ,我 们 通常 希望 用 一 个 新 种 子 开始 程序 
的 每 次 运行 。 实 际 上 ， 为 了 让 游戏 不 可 预测 ， 从 程序 运行 环境 中 选取 一 个 种 子 通常 是 很 有 帮 
助 的 。 对 这 类 程序 ， 从 实时 时 钟 提取 一 些 二 进 制 位 通常 能 构造 一 个 好 的 种 子 。 


40.8 建议 


[1] 数值 问题 常常 很 微妙 。 如 果 你 对 一 个 数值 问题 的 数学 内 核 不 是 100% 确定 ， 应 接 
受 专 家 建议 或 者 做 一 些 实验 ， 或 者 两 者 都 做 ; 29.1 节 。 

2 ] 根据 用 途 恰当 选择 数值 类 型 的 变 体 ; 40.2 节 。 

3 ]」 用 numeric_ limits 检查 数值 类 型 是 否 满足 其 用 途 的 需求 ; 40.2 节 。 

4 ]」 为 用 户 自 定义 数值 类 型 特例 化 numeric_limits; 40.2 节 。 

[5] 优先 选择 numeric_limits 而 不 是 数值 限制 宏 ; 40.2.1 节 。 

[6] 用 std::complex 进行 复数 运算 ; 40.4 节 。 

7」 用 人 初始 化 避免 窗 化 ; 40.4 节 。 

8 ] 当 运 行 时 效率 比 操作 和 元 素 类 型 角度 的 灵活 性 更 重要 时 ， 使 用 valarray 实现 数值 
计算 ; 40.5 节 。 

L9 ] 用 切片 而 不 是 循环 表达 数组 一 部 分 的 运算 ; 40.5.5 节 。 

[10」 切片 是 访问 紧凑 数据 的 很 有 用 的 通用 抽象 ; 40.5.4 节 ，40.5.6 节 。 

[11] 在 手工 编写 循环 实现 从 序列 计算 值 之 前 ， 首 先 考虑 使 用 accumulate()、inner_ 

product()、partial_sum() 和 adjacent_difference(); 40.6 闻 。 

[12 ] 将 引擎 绑 定 到 分 布 ， 来 获得 所 需 的 随机 数 发 生 器 ; 40.7 节 。 

[13 】 要 小 心 谨慎 , 令 你 的 随机 数 发 生 器 足够 随机 ; 40.7.1 节 。 

[14] 如 果 你 需要 真正 的 随机 数 (而 不 只 是 一 个 伪 随 机 序列 )， 使 用 random_device ; 

40.7.2 节 。 

[15 ] 优先 选择 产生 特定 分 布 的 随机 数 类 而 不 是 直接 使 用 rand(); 40.7.4 市。 
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保持 简单 : 尽 可 能 地 简单 ， 但 不 要 过 度 简化 。 
一 一 A， 爱 因 斯 坦 


e 引言 
e 内 存 模型 

内 存 位置 ; 指令 重 排 ; 内 存 序 ; 数据 竞争 
e 原子 性 

atomic 类 型 ; 标志 和 栅栏 

® Volatile 

e 建议 
41.1 引言 

并 发 ， 即 多 个 任务 同时 执行 ,广泛 用 于 提高 吞吐 率 (使 用 多 个 处 理 器 完成 单个 运算 ) 或 
提高 响应 能 力 〈 当 程序 的 一 部 分 等 待 响应 时 允许 另 一 部 分 继续 执行 )。 

我 们 在 5.3 节 中 已 经 介绍 了 C++ 标准 对 并 发 的 支持 ， 当 然 只 是 一 种 导 览 的 形式 ， 本 章 
和 下 一 章 将 提供 更 加 细致 、 更 加 系统 化 的 介绍 。 

如 果 一 项 活动 可 能 与 其 他 活动 并 发 执行 ， 我 们 就 称 之 为 任务 (task)。 线 程 (thread) 是 
执行 任务 的 计算 机 特性 在 系统 层面 的 表示 。 一 个 标准 库 thread ( 见 42.2 节 ) 可 执行 一 个 任 
务 。 一 个 线程 可 与 其 他 线程 共享 地 址 空间 。 即 ， 在 单一 地 址 空间 中 的 所 有 线程 能 访问 相同 
的 内 存 位置 。 而 并 发 系统 程序 员 所 面临 的 重要 挑战 之 一 就 是 ， 确 保 多 线程 并 发 访问 内 存 的 
方式 是 合理 的 。 

标准 库 对 并 发 的 支持 包括 : 

@ 内 存 模型 (memory model): 这 是 对 内 存 并 发 访问 的 一 组 保证 ( 见 41.2 节 )， 主 要 是 确 
保 简单 的 普通 访问 能 按 人 们 的 朴素 预期 工作 ; 

对 无 锁 编 程 (programming without locks) 的 支持 : 这 是 一 些 避 免 数据 竞争 的 细 粒 度 
底层 机 制 ( 见 41.3 节 ); 

一 个 线程 (thread) 库 : 这 是 一 组 支持 传统 线程 - 锁 风 格 的 系统 级 并 发 编程 的 组 件 ， 
如 thread、condition_variable 和 mutex ( 见 42.2 节 ); 

一 个 任务 (task) 支持 库 : 这 是 一 些 支 持 任务 级 并 发 编程 的 特性 : future 、promise、 
packaged task 和 async() ( 见 42.4 节 )。 

这 些 主题 是 按照 从 最 基础 、 最 底层 到 最 高 层 的 顺序 排列 的 。 内 存 模型 是 所 有 编程 风格 所 共用 
的 。 为 提高 程序 员 开 发 效率 、 尽 量 减少 错误 ， 应 在 尽 可 能 高 的 层次 上 编程 。 例 如 ， 应 优先 
选择 future 而 不 是 mutex 实现 信息 交换 ; 除非 是 简单 的 计数 器 ， 否 则 应 优选 mutex 而 不 是 
atomic; 诸如 此 类 。 尽 量 将 复杂 任务 留 给 标准 库 实 现 者 。 
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在 C++ 标准 库 的 语 境 中 ， 一 个 锁 (lock) 就 是 一 个 mutex (一 个 互 斥 量 ) 以 及 任何 构建 
于 mutex 之 上 的 抽象 ， 用 来 提供 对 资源 的 互 斥 访 问 或 同步 多 个 并 发 任务 的 进度 。 

进程 (process) 即 运行 于 独立 地 址 空间 、 通 过 进程 间 通 信 机 制 进行 交 互 的 线程 
[Tanenbaum, 2007]， 并 不 在 本 书 介绍 范围 之 内 。 我 猜 在 学 习 了 共享 数据 管理 的 相关 问题 和 技 
术 之 后 ， 你 可 能 会 对 我 的 观点 “最 好 避免 显 式 数据 共享 ”产生 共鸣 。 自 然 ， 通 信也 意味 着 某 
种 形式 的 共享 ， 但 大 多 数 情况 下 应 用 程序 员 不 必 直 接管 理 这 种 共享 。 

还 请 注意 ， 只 要 你 不 向 其 他 线程 传递 局 部 数据 的 指针 ， 你 的 局 部 数据 就 不 存在 这 里 讨论 
的 诸多 问题 。 这 也 是 避免 使 用 全 局 数据 的 另 一 个 原因 。 

本 章 不 是 对 并 发 编程 的 一 个 全 面 介 绍 ， 甚 至 不 会 全 面 介 绍 C++ 标准 库 并 发 编程 特性 。 
本 章 讨 论 : 

e 必须 处 理 系统 级 并 发 的 程序 员 所 面临 问题 的 基本 介绍 ; 

e 标准 并 发 特性 的 一 个 相当 详细 的 综述 ; 

e 介绍 线程 - 锁 层次 及 更 高 层次 上 标准 库 并 发 特性 的 基本 使 用 。 
本 章 不 讨论 : 

e 放松 内 存 模 型 或 无 锁 编 程 的 细节 ; 

e 高 级 并 发 编程 和 设计 技术 
并 发 编程 和 并 行 编程 是 学 术 界 很 受 关注 的 主题 ， 已 广泛 应 用 超过 40 年 ， 因 此 有 大 量 专门 的 
文献 (例如 ， 基 于 C++ 的 并 发 编程 可 参考 [Wilson, 1996]) 。 特 别 是 ， 几 乎 所 有 POSIX 线程 
的 介绍 中 的 例子 都 可 以 用 本 章 介 绍 的 标准 库 特 性 进行 简单 改进 。 

与 C 风格 POSIX 特性 以 及 很 多 旧式 C++ 线程 支撑 库 不 同 ， 标 准 库 线 程 支持 是 类 型 安全 
的 。 再 没有 任何 理由 去 乱用 宏 或 void 六 来 实现 线程 间 信 息 传 递 了 。 类 似 地 ， 我 们 可 以 以 函 
数 对 象 (如 lambda) 的 形式 定义 任务 并 将 它们 传递 给 线程 ， 而 无 须 进行 类 型 转换 或 担心 类 型 
违规 。 而 且 ， 也 没有 理由 再 去 发 明 精 致 的 协议 将 来 自 一 个 线程 的 错误 消息 报告 给 另 一 个 线 
程 一 一 future ( 见 5.3.5.1 节 和 42.4.4 节 ) 已 可 传递 异常 。 考 虑 到 并 发 软件 通常 很 复杂 ， 而且 
运行 于 不 同 线程 中 的 代码 通常 是 分 别 开 发 的 ， 我 认为 类 型 安全 和 一 种 标准 的 (最 好 是 基于 异 
常 的 ) 错误 处 理 策略 甚至 比 在 单线 程 软件 场景 下 更 为 重要 。 此 外 ， 标 准 库 线程 支持 还 大 幅度 
简化 了 符号 表示 。 


41.2 ”内 存 模型 


C++ 实现 大 多 以 标准 库 组 件 的 形式 提供 对 并 发 机 制 的 支持 。 这 些 组 件 依 赖 于 一 组 称 为 
内 存 模 型 ( memory model) 的 语言 保证 。 内 存 模 型 是 计算 机 设计 师 和 编译 器 实现 者 之 间 关 于 
计算 机 硬件 最 佳 表示 方式 的 讨论 结果 。 如 ISO C++ 标准 库 所 指出 ， 内 存 模 型 描述 了 编译 器 
实现 者 与 程序 员 之 间 的 约定 ， 确 保 大 多 数 程序 员 不 必 考 虑 现代 计算 机 硬件 的 细节 。 

为 了 理解 所 涉及 的 问题 ， 请 记 住 一 个 简单 事实 : 对 内 存 中 对 象 的 操作 永远 不 直接 处 理 内 
存 中 的 对 象 ， 而 是 将 对 象 加 载 到 处 理 器 的 寄存 器 中 ,在 那里 修改 它 ， 然 后 再 写 回 内 存 。 更 糟 
的 是 ， 对 象 通常 首先 从 主 存 加 载 到 缓存 中 ， 然 后 再 加 载 到 寄存 器 。 例 如 ， 考 虑 递增 一 个 简单 
的 整数 X: 

/将 x 加 1: 

load x into cache element Cx 
load Cx into register Rx 
Rx=Rx+1; 





党 41 莫 洋 发 281 








store Rx back into Cx 
store Cx back into x 


内 存 可 被 多 个 线程 共享 ， 而 缓存 也 可 (依赖 于 机 器 体系 结构 ) 被 运行 于 相同 或 不 同 “处理 单 
元 ”( 通 常 被 称 为 处 理 器 (processor)、 核 心 (core) 或 超 线程 (hyper-thread) ; 这 是 一 个 系统 
特性 和 术语 都 快速 演变 的 领域 ) 的 线程 所 共享 。 这 导致 简单 操作 (如 “将 x 加 1”) 都 有 很 大 
可 能 月 演 。 这 里 的 描述 已 是 经 我 简化 了 的 ， 计 算 机 体系 结构 专家 很 容易 发 现 这 一 点 。 有 些 人 
可 能 注意 到 我 没有 提 及 存储 缓冲 ， 我 推荐 参考 [McKenney, 2012] 的 附录 C。 


41.2.1 内存 位 置 


考虑 两 个 全 局 变量 b 和 c: 
儿 线程 1: 1 线程 2: 
charc=0; char b= 0; 
void f() void g() 
{ { 
c=1; b=1; 
int x = C; int y = b; 
} } 


现在 ， 如 大 家 所 期 望 ，x==1 且 y==1。 为 什么 这 也 值得 一 提 ? 考虑 如 果 链 接 器 将 b 和 c 分配 
到 相同 的 内 存 字 且 机 器 存 取 的 最 小 单位 是 字 (大 多 数 现代 硬件 都 是 如 此 )， 将 会 发 生 什么 : 








字 : Cc b 

















如 果 没 有 定义 良好 的 合理 内 存 模型 ， 线 程 1 将 会 读 取 包含 b 和 c 的 字 ， 修改 c， 并 将 该 字 写 
回 内 存 。 同 时 ,线程 2 可 能 会 对 b 做 相同 的 事情 。 这 样 ， 哪 个 线程 先 读 取 该 字 ， 哪 个 线程 后 
将 结果 写 回 内 存 ， 将 决定 内 存 中 的 最 终结 果 是 什么 。 我 们 可 能 得 到 10、01 或 11 (但 不 会 是 
00)。 内 存 模型 可 让 我 们 避免 这 种 混乱 一 一 我 们 肯定 得 到 11。00 不 会 发 生 的 原因 是 b 和 
的 初始 化 是 在 所 有 线程 启动 之 前 就 (由 编译 器 或 链接 器 ) 完成 的 。 

C++ 内 存 模型 保证 两 个 更 新 和 访问 不 同 内 存 位 置 的 线程 可 以 互 不 影响 地 执行 。 这 恰 是 
我 们 的 朴素 期 望 。 防 止 我 们 遇 到 现代 硬件 有 时 很 奇怪 和 微妙 的 行为 是 编译 器 的 任务 。 编 译 融 
和 硬件 如 何 协作 来 实现 这 一 目的 应 由 编译 器 负责 。 我 们 编程 所 用 的 “机 器 ”实际 上 是 由 硬件 
和 非常 底层 的 (由 编译 器 生成 的 ) 软件 组 合 提供 的 。 

使 用 位 域 ( 见 8.2.7 节 ) 可 访问 字 的 一 部 分 。 如 果 两 个 线程 同时 访问 两 个 属于 同一 个 字 
的 位 域 ， 则 结果 难 料 。 假 定 bp 和 c 就 是 这 两 个 位 域 ， 大 多 数 硬 件 如 果 不 借助 某 种 形式 的 〈 可 
能 代价 非常 高 ) 锁 机 制 的 话 ， 是 无 法 避免 上 述 b 和 c 示例 中 展示 的 问题 (竞争 条 件 ) 的 。 以 
加 锁 和 解锁 操作 的 代价 ， 是 无 法 隐 式 施加 于 位 域 之 上 的 ， 它 们 常常 用 于 关键 的 设备 驱动 程 
序 。 因 此 ，C++ 语言 将 内 存 位 置 (memory location) 定义 为 能 保证 合理 行为 的 内 存单 元 ， 从 
而 排除 了 单独 的 位 域 。 

一 个 内 存 位 置 可 以 是 一 个 算术 类 型 ( 见 6.2.1 节 ) 对 象 、 一 个 指针 或 一 个 非 零 宽度 相 邻 
位 域 的 最 大 序列 。 例 如 : 











struct S{ 
char a; 儿 位 置 #1 
int b:5; 省 位置 机 


unsigned c:11; 
unsigned :0; 川 注意; 0 是 “特殊 的 ”( 见 8.2.7 节 ) 
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unsigned d:8; 咱 位 置 妇 
struct { int ee:8; } @; // 位 置 树 
}; 
在 本 例 中 , S 包含 四 个 独立 的 内 存 位 置 。 如 无 显 式 同步 ， 不 要 试图 从 不 同 线程 更 新 位 域 b 和 c。 
从 上 面 的 解释 中 ， 你 可 能 已 总 结 出 : 如 果 x 和 yy 是 相同 类 型 ，x=y 会 保证 x 最 终 成 为 y 
的 一 份 拷贝 。 这 个 结论 当 且 仅 当 没有 发 生 数 据 竞争 〈 见 41.2.4 节 ) 且 x 和 yy 都 是 内 存 位置 时 
才 成 立 。 但 是 ， 如 果 x 和 yy 是 多 字 节 的 struct 类 型 ， 它 们 就 不 是 单一 的 内 存 位 置 ， 如 果 遇 到 
了 数据 竞争 ， 所 有 行为 都 是 未 定义 的 。 因 此 ， 如 果 你 需要 共享 数据 ， 应 该 确保 在 恰当 的 位 置 
正确 进行 同步 ( 见 41.3 节 和 42.3.1 节 )。 


41.2.2 ”指令 重 排 


为 提高 性 能 ， 编 译 器 、 优 化 器 以 及 硬件 都 可 能 重 排 指 令 顺序 。 考 虑 下 面 的 代码 : 
儿 线程 1: 
int X; 
bool x_init; 
void init() 
x = initialize(); // 在 initialize() 中 不 会 用 到 x_init 
X_init = true; 
外. 
} 


对 这 段 代码 而 言 ， 没 有 什么 必需 的 理由 将 x 的 赋值 放 在 x_init 的 赋值 之 前 。 优 化 器 (或 硬件 
指令 调度 器 ) 可 能 决定 先 执行 x_init = true 来 加 速 程序 。 

我 们 可 能 用 x_init 指出 x 是否 已 被 initialize() 初始 化 。 但 是 ， 我 们 并 没有 声明 这 一 点 ， 
因此 硬件 、 编 译 器 以 及 优化 器 对 此 都 不 了 解 。 

向 程序 中 添加 另 一 个 线程 : 


/ 儿 | 线程 2: 
extern int x; 
extern bool x_init; 


void f2() 
{ 
int y; 
while (!x_init) 咱 若 需要 ， 等 待 初始 化 结束 
this_thread::sleep_for(milliseconds{10})); 
y=x; 
I... 
} 


现在 就 出 现 了 一 个 问题 的 : 线程 2 可 能 永远 也 不 会 等 待 ， 从 而 将 一 个 未 初始 化 的 X 赋 予 y。 
可 以 看 到 ， 即 使 线程 1 未 将 x_init 和 x 置 于 “错误 顺序 "， 我 们 仍 可 能 遇 到 问题 。 在 线 

程 2 中 ,没有 对 x_init 的 赋值 ， 因 此 优化 器 可 能 决定 将 !x_init 的 求 值 提 到 循环 之 外 ， 从 而 线 

程 2 或 者 永 不 睡眠 ,或 者 一 睡 不 醒 。 

41.2.3 ”内 存 序 


将 一 个 字 的 值 从 内 存 加 载 到 缓存 ， 然 后 再 加 载 到 寄存 器 ， 所 花费 的 时 间 〈 以 处 理 器 的 时 间 
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衡量 ) 可 能 非常 长 。 最 好 情况 可 能 也 要 500 个 指令 的 执行 时 间 来 将 一 个 值 加 载 到 寄存 器 ， 而 将 一 
个 新 值 送 回 它 的 内 存 位 置 又 将 花费 500 个 指令 时 间 。 数 字 500 是 猜测 值 ， 它 依赖 于 机 器 的 体系 结 
构 ， 且 在 不 断 变化 ,但 在 过 去 十 年 ， 此 值 是 持续 增长 的 。 当 程序 针对 吞吐 率 进行 了 优化 ， 不 急于 
存 取 特 定 值 时 ， 花 费 的 时 间 可 能 更 长 。 一 个 值 可 能 持续 “离开 位 置 ”长 达 数 万 个 指令 周期 。 这 是 
导致 现代 计算 机 硬件 获得 惊人 性 能 的 原因 之 一 ， 但 也 令 不 同 线程 在 不 同时 间 、 在 内 存 层次 不 同位 
置 访问 数值 很 可 能 产生 混乱 。 例 如 ， 我 对 机 器 体系 结构 的 简化 描述 中 只 提 到 了 单一 缓存 ; 但 很 多 
流行 的 体系 结构 都 使 用 三 级 缓存 。 为 了 说 明 问 题 ， 下 面 给 出 了 一 个 可 能 的 两 级 缓存 结构 示意 图 ， 
其 中 每 个 核心 都 有 独 享 的 二 级 缓存 ， 一 对 核心 共享 一 个 一 级 缓存 ， 而 所 有 核心 共享 主 存 : 


核心 ! 核心 2 核心 3 核心 4 
缓存 2.1 缓存 2.2 | 缓存 23 | |「 缓存 2.4 
[i 缓存 1.1 | 缓存 1.2 
| 主 存 














术语 内 存 序 ( memory ordering) 用 来 描述 一 个 线程 从 内 存 访 问 一 个 值 时 会 看 到 什么 。 最 简单 
的 内 存 序 称 为 顺序 一 致 性 ( sequentially consistent) 。 在 一 个 顺序 一 致 性 内 存 模 型 中 ， 每 个 线 
程 看 到 的 是 相同 的 操作 执行 效果 ， 此 顺序 就 像 是 所 有 指令 都 在 单一 线程 中 顺序 执行 一 样 。 线 
程 仍 可 重 排 指令 ,但 对 其 他 线程 可 以 观察 变量 的 每 个 时 间 点 ， 时 间 点 前 执行 的 指令 集合 ( 因 
而 ) 和 观察 到 的 内 存 位 置 的 值 必须 是 明确 定义 的 且 对 所 有 线程 都 一 致 。“ 观 察 值 ”从 而 强制 
内 存 位 置 的 一 个 一 致 性 视图 的 操作 被 称 为 原子 操作 ( atomic operation) ( 见 41.3 节 )。 一 个 简 
单 读 或 写 操作 不 强加 一 个 顺序 。 
对 给 定 的 一 组 线程 ， 可 能 存在 很 多 顺序 一 致 性 序 。 考 虑 下 面 的 代码 : 





1 线程 1: W 线程 2: 
char c = 0; char b = 0; 
extern char b; extern char c; 
void f1() void f2() 
《 { 
c=1; b=1; 
int x = b; inty=c; 
} } 
假定 c 和 ob 的 初始 化 是 静态 完成 的 (在 任何 线程 启动 之 前 )， 那 么 共有 3 种 可 能 的 执行 顺序 : 
c=1; b=1; c=1; 
x=b; y=c; b=1; 
b=1; c=1; x=b; 
y= ci x=b; y= ci 


执行 结果 分 别 是 01、10 和 11， 唯 一 不 可 能 得 到 的 结果 是 00。 显 然 ， 为 了 得 到 一 个 可 预测 
的 结果 ， 你 需要 对 共享 变量 的 访问 进行 某 种 形式 的 同步 。 

顺序 一 致 性 序 差不多 包括 一 个 程序 员 能 有 效 推 出 的 所 有 结果 ， 但 在 某 些 机 器 体系 结构 上 
它 会 强加 严重 的 同步 开销 ， 而 放松 一 致 性 规则 就 可 消除 这 种 开销 。 例 如 ， 两 个 运行 于 不 同 核 
心 的 线程 决定 在 写 c 和 b 之 前 就 开始 读 x 和 y， 或 者 至 少 在 写 操作 完成 之 前 就 开始 读 。 这 可 
能 得 到 非 顺 序 一 致 性 结果 00。 更 放松 的 内 存 模型 是 允许 出 现 这 种 结果 的 。 


41.2.4 数据 竞争 
从 以 上 这 些 例 子 ， 任 何 有 判断 力 的 人 都 会 得 出 结论 : 对 于 多 线程 编程 我 们 必须 非常 小 
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心 。 但是， 如 何 小 心 ? 首先 ， 我 们 必须 避免 数据 竞争 ( data race)。 如 果 两 个 线程 同时 访问 同 
一 个 内 存 位 置 (如 41.2.1 节 所 定义 ) 且 至 少 其 中 之 一 是 进行 写 操 作 时 ， 它 们 就 会 产生 数据 竞 
争 。 注 意 ， 准 确定 义 “同时 ”并 不 简单 。 如 果 两 个 线程 存在 数据 竞争 ，C++ 语言 就 无 法 给 出 
任何 保证 了 : 它们 的 行为 是 未 定义 的 。 虽 然 听 起 来 有 些 偏激 ， 但 数据 竞争 的 后 果 (如 41.2.2 
节 所 示 ) 可 能 是 很 严重 的 。 优 化 器 (或 硬件 指令 调度 器 ) 可 能 基于 对 内 存 中 值 的 一 些 假设 重 
排 代码 ， 也 可 能 基于 这 种 假设 执行 或 不 执行 (显然 影响 不 相关 数据 的 ) 代码 段 。 
有 很 多 方法 可 用 来 避免 数据 竞争 : 
e 只 使 用 单线 程 。 但 这 会 丢掉 并 发 的 好 处 (除非 你 使 用 多 进程 或 协同 例 程 )。 
e 对 每 个 有 明显 数据 竞争 倾向 的 数据 项 使 用 锁 机 制 。 这 会 削弱 并 发 在 性 能 上 的 优势 ， 
效率 变 得 几乎 与 单线 程 一 样 ， 因 为 我 们 很 容易 进入 除了 一 个 线程 之 外 所 有 其 他 线程 
都 处 于 等 待 的 状态 。 更 糟 的 是 ， 大 量 使 用 锁 还 会 增加 死 锁 的 可 能 ， 出 现 一 个 线程 永 
远 等 待 另 一 个 线程 的 情况 以 及 其 他 锁 相 关 的 问题 。 
尝试 仔细 检查 代码 ， 选 择 性 地 添加 锁 来 避免 数据 竞争 。 这 可 能 是 当前 最 流行 的 方法 ， 
但 很 容易 出 错 。 
证 检测 软件 检测 所 有 数据 竞争 并 报告 给 程序 员 来 修正 或 自动 插入 锁 。 但 是 ， 很 少 有 
软件 能 处 理 产 品级 规模 和 复杂 度 的 程序 。 既 能 完成 这 种 功能 又 能 保证 无 死 锁 的 软件 
还 处 于 实验 室 阶段 。 
设计 代码 ， 令 线程 通信 仅 通 过 放 - 取 风 格 的 接口 完成 ， 而 不 会 要 求 两 个 线程 直接 操 
作 单 一 内 存 位 置 ( 见 5.3.5.1 节 和 42.4 节 )。 
使 用 更 高 屋 的 库 或 工具 实现 隐 式 或 足够 程式 化 的 数据 共享 或 并 发 ， 从 而 令 共享 可 管 
理 。 这 方面 的 例子 包括 库 中 算法 的 并 行 实现 、 基 于 指令 的 工具 (如 OpenMP) 以 及 事 
务 内 存 (transactional memory， 通 常 简称 为 TM )。 
我 们 可 以 用 一 种 自 底 向 上 的 方式 学 习 本 章 剩 余 内 容 ， 以 标准 库 中 对 最 后 一 种 编程 风格 的 
变 体 的 支持 结束 。 在 此 过 程 中 ,我们 会 涉及 几乎 所 有 避免 数据 竞争 的 工具 。 
为 什么 程序 员 必 须 忍 受 这 一 切 复杂 性 呢 ? 为 什么 不 提供 一 种 简单 的 具有 最 小 (或 没有 ) 
数据 竞争 问题 的 顺序 一 致 性 模型 作为 蔡 代 呢 ? 我 可 以 指出 两 个 原因 : 
L 1] 现实 本 来 就 不 是 这 样 的 。 机 器 体系 结构 的 复杂 性 是 客观 存在 的 ， 系 统 程序 设计 语 
言 如 C++ 必须 为 程序 员 提供 工具 来 与 这 种 复杂 性 共存 。 也 许 某 一 天 机 器 设计 师 会 
发 布 更 简单 的 替代 方案 ， 但 目前 程序 员 必 须 处 理 机 器 设计 师 提 供 的 各 种 令 人 眼花 
绑 乱 的 底层 特性 才能 满足 终端 用 户 的 性 能 需求 。 

[2] 我 们 (C++ 标准 委员 会 ) 曾 认 真 考虑 过 这 个 问题 。 我 们 本 想 提供 一 个 内 存 模型 ， 
可 视 为 Java 和 C# 提供 的 模型 的 改进 版 本 。 它 可 能 节省 委员 会 和 一 些 程序 员 的 大 
量 工作 。 但 是 这 一 想法 被 操作 系统 和 虚拟 机 的 提供 商 否 决 了 : 他 们 坚 称 他 们 所 需 
要 的 大 致 就 是 当时 各 种 C++ 实现 所 提供 的 一 一 也 是 现在 C++ 标准 所 提供 的 。 替 
代 方 案 可 能 令 你 的 操作 系统 和 虚拟 机 变 慢 “ 两 倍 或 更 多 ”。 我 猜测 C++ 语言 的 狂 
热 支持 者 可 能 会 欢迎 以 牺牲 其 他 语言 为 代价 简化 C++ 的 机 会 ， 但 这 样 做 既 不 现实 
也 不 职业 。 

幸运 的 是 ， 大 多 数 程序 员 永 远 不 必 直 接 在 硬件 的 最 底层 编程 ， 也 完全 无 须 理解 内 存 模 
型 ， 将 指令 重 排 问题 看 作 有 趣 的 奇 事 即 可 : 

编写 无 数据 竞争 的 代码 且 不 去 碰 内 存 序 ( 见 41.3 节 ); 然后 内 存 模型 即 可 保证 代码 如 我 
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们 的 朴素 预期 那样 执行 。 这 甚至 优 于 顺序 一 致 性 。 

我 发 现 计算 机 体系 结构 是 一 个 吸引 人 的 主题 (请 参考 如 [Hennesey, 2011] [McKenney, 
2012]), 但 像 所 有 理智 和 高 效率 的 程序 员 一 样 ， 我 们 应 尽 可 能 远离 底层 软件 。 这 应 该 留 给 专 
家 ， 而 我 们 只 需 尽 情 享受 专家 提供 给 我 们 的 高 层 抽象 即 可 . 


41.3 ”原子 性 


所 谓 无 锁 编 程 ， 就 是 一 组 用 来 编写 不 显 式 使 用 锁 的 并 发 程序 的 技术 。 程 序 员 转 而 依靠 原 
语 操作 (由 硬件 直接 支持 ) 来 避免 小 对 象 (通常 是 单一 字 或 双 字 ) 的 数据 竞争 ( 见 41.2.4 节 )。 
不 必 忍 受 数据 竞争 的 原 语 操作 通常 被 称 为 原子 操作 ( atomic operation)， 可 用 来 实现 高 层 并 
发 机 制 ， 如 锁 、 线 程 和 无 锁 数据 结构 。 

除了 简单 的 原子 计数 器 这 一 明显 例外 ， 无 锁 编 程 通常 很 复杂 ， 最 好 留 给 专家 使 用 。 为 
了 进行 无 锁 编 程 ， 除 了 理解 语言 机 制 ， 还 要 详细 了 解 特 定 的 机 器 体系 结构 以 及 专门 的 实现 技 
术 。 不 要 仅仅 学 习 了 本 书 就 尝试 无 锁 编 程 。 无 锁 技 术 较 之 于 锁 机 制 的 主要 优势 是 不 会 发 生 典 
型 的 锁 问 题 ， 如 死 锁 和 狐 死 。 对 每 个 原子 操作 ， 可 保证 即使 有 其 他 线程 竞争 访问 原子 对 象 ， 
当前 线程 最 终 (通常 很 快 ) 能 继续 前 进 。 而 且 ， 无 锁 技 术 会 比 基 于 锁 的 替代 方法 快 得 多 。 

标准 原子 类 型 和 原子 操作 提供 了 无 锁 代 码 传统 表达 方式 之 外 的 一 种 可 移植 的 表达 方式 。 
它们 通常 依赖 于 汇编 代码 或 系统 相关 的 原 语 。 从 这 个 意义 上 说 ， 标 准 对 原子 性 的 支持 符合 C 
和 C++ 提高 可 移植 性 和 系统 编程 支持 力度 的 传统 ， 是 这 一 悠久 传统 迈 出 的 新 的 一 步 。 

同步 操作 用 来 确定 线程 何 时 看 到 另 一 个 线程 的 执行 效果 ; 即 ， 确 定 了 哪些 操作 被 认为 
是 在 另 一 些 操作 之 前 发 生 。 在 同步 操作 之 间 ， 编 译 器 和 处 理 器 可 月 由 重 排 代 码 顺序 ， 只 要 语 
言 的 语义 规则 得 以 保持 既 可 。 原 则 上 ， 并 无 人 监控 实现 同步 ， 只 有 性 能 受到 一 些 影响 。 一 
个 或 多 个 内 存 位 置 上 的 同步 操作 包括 消费 操作 、 获 取 操 作 、 释 放 操 作 或 集 后 两 者 为 一 身 ( 见 
iso.1.10 )。 

@ 对 一 个 获取 操作 (acquire operation)， 其 他 处 理 器 会 在 任何 后 继 操 作 的 效果 之 前 看 到 


其 效果 。 
e 对 一 个 释放 操作 (release operation)， 其 他 处 理 器 会 在 其 效果 之 前 看 到 每 个 前 驱 操作 
的 效果 。 


@ 消费 操作 (consume operation) 是 一 种 弱化 的 获取 操作 。 对 一 个 消费 操作 ， 其 他 处 理 
器 会 在 任何 后 继 操 作 的 效果 之 前 看 到 其 效果 ， 例 外 是 不 依赖 于 消费 操作 的 值 的 效果 
可 能 在 消费 操作 之 前 被 看 到 。 
原子 操作 可 确保 内 存 状 态 如 特定 内 存 序 ( 见 41.2.2 节 ) 所 要 求 的 那样 。 默 认 情 况 下 ， 内 存 序 
为 memory_order_seq_cst (顺序 一 致 性 ; 见 41.2.2 节 )。 标准 内 存 序 包 括 ( 见 iso.29.3 ): 


enum memory_order { 
memory_order_relaxed, 
memory_order_consume, 
memory_order_acquire, 
memory_order_release, 
memory_order_acq_rel, 
memory_order_seq_cst 

} 

这 些 枚 举 值 表示 : 
e memory_order_relaxed: 无 操作 定 内 存 序 。 
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e emory_order_release、memory_order_ acq_rel 和 memory_order_ seq_cst : 存储 
操作 对 影响 的 内 存 位 置 执行 一 个 释放 操作 。 
e memory_order_consume: 读 取 操作 对 影响 的 内 存 位 置 执 行 一 个 消费 操作 。 
e memory_order_ acquire 、memory_order_ acq_rel 和 memory_order seq_cst : 读 
取 操 作对 影响 的 内 存 位 置 执行 一 个 获取 操作 。 
作为 一 个 例子 ， 考 虑 ( 见 iso.29.3 ) 使 用 atomic 读 取 和 存储 操作 ( 见 41.3.1 节 ) 来 表达 放松 内 
存 序 : 


儿 线程 1: 
r1 = yload(memory_order_relaxed); 
x.store(ri,memory_order_relaxed); 


/| 线程 2: 
r2 = x.joad(memory_order_relaxed); 
ystore(42,memory_order_relaxed); 


这 段 代 码 可 能 产生 r2==42 的 结果 ， 就 好 像 线程 2 上 的 时 间 倒 流 了 一 样 。 即 ， 人 允许 下 面 这 种 
执行 顺序 : 


ystore(42,memory_order_relaxed); 
r1 = yload(memory_order_relaxed); 
x.store(r1,memory_order_relaxed); 
r2 = x.load(memory_order_relaxed); 


对 此 的 解释 请 参考 专业 文献 ， 如 [Boehm, 2008] 和 [Williams, 2012] 。 

一 种 给 定 的 内 存 序 是 否 有 意义 完全 是 由 体系 结构 决定 的 。 显 然 ， 放 松 内 存 模 型 并 不 适合 
直接 用 于 应 用 编程 。 利 用 放松 内 存 模型 甚至 比 一 般 无 锁 编 程 更 具 专业 性 。 我 将 其 视 为 应 由 操 
作 系 统 内 核 、 设 备 驱动 程序 和 虚拟 机 实现 者 的 一 个 小 规模 子 集 所 完成 的 东西 。 它 在 代码 自动 
生成 中 也 很 有 用 (类似 goto)。 如 果 两 个 线程 真 的 不 直接 共享 数据 ， 在 某 些 机 器 体系 结构 上 
使 用 放松 内 存 模型 会 带 来 显著 的 性 能 提升 ， 代 价 是 消息 传递 原 语 〈 如 future 和 promise ; 见 
42.4.4 节 ) 的 实现 较为 复杂 。 

为 了 能 在 采用 放松 内 存 模型 的 架构 上 实现 显著 优化 ，C++ 标 准 提供 了 一 个 属性 
[[carries_dependency]]， 可 跨越 函数 调用 传递 内 存 序 依赖 性 ( 见 iso.7.6.4 )。 例 如 : 

[[carries_dependency]] struct foo* f(int i) 

儿 令 调用 者 对 结果 使 用 memory_order_consume: 
return foo_head[il.load(memory_order_consume); 

} 

你 还 可 以 将 [[carries_dependency]] 作为 函数 实 参 ， 标 准 还 提供 了 一 个 函数 kill_dependency() 
来 停止 这 种 依赖 的 传播 。 

C++ 内 存 模型 的 设计 者 之 一 Lawrence Crowl 总 结 说 : 

“依赖 序 可 能 是 最 复杂 的 并 发 特性 。 以 下 场景 真正 值得 使 用 它 : 

e 它 在 你 的 机 器 上 很 重要 ; 

e 你 有 一 个 非常 高 带宽 的 以 读 为 主 的 原子 数据 结构 ; 

e 你 愿意 花费 数 个 星期 测试 程序 及 阅读 外 部 文档 。 

它 确 实 属于 专家 领域 。 

请 接受 专家 的 忠告 。 
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41.3.1 atomic 类 型 


原子 类 型 (atomic type) 是 atomic 模板 的 特例 化 版 本 。 原 子 类 型 的 对 象 上 的 操作 是 原子 
的 〈atomic)。 即 ， 操 作 由 单一 线程 执行 ， 不 会 受到 其 他 线程 干扰 。 

原子 类 型 上 的 操作 非常 简单 ， 包 括 简 单 对 象 (通常 是 一 个 单一 内 存 位 置 ; 见 41.2.1 节 ) 
上 的 : 读 取 和 存储 、 交 换 、 递 增 ， 等 等 。 这 些 操作 必须 简单 ， 否 则 硬件 不 能 直接 处 理 。 

我 希望 通过 下 表 给 出 原子 类 型 的 第 一 印象 和 概览 ( 仅 此 而 已 )。 除 非特 别 说 明 ， 否 则 内 
存 序 是 memory_order_seq_cst (顺序 一 致 性 )。 


atomic<T> (iso.29.5 ) 
x.val 表示 原子 对 象 x 的 值 ; 所 有 操作 都 是 noexcept 的 





atomic x; x 未 初始 化 

atomic x {}; 默认 构造 函数 ; x.val=T{}; constexpr 

atomic x {t}; 构造 函数 ; x.val=t; constexpr 

x=t T 类 型 对 象 赋值 ; x.val=t 

t=x 隐 式 转换 为 类 型 T; t=x.val 

x.is_lock_free() x 上 的 操作 是 无 锁 的 ? 

x.store(t) x.val=t 

x.store(t,order) Xx.val=t; 内 存 序 为 order 

t=x.load() t=x.val 

t=x.load(order) t=x.val; 内 存 序 为 order 

t2=x.exchange(t) 交换 x 和 t 的 值 ， t2 为 x 的 旧 值 
t2=x.exchange(t,order) 交换 x 和 t 的 值 ; 内 存 序 为 order; t2 为 x 的 旧 值 
b=x.compare_exchange_weak(rt,t) 若 b=(x.val==rt)，x.val=t， 否 则 rt=x.val; rt 是 一 个 T& 


b=x.compare_exchange_weak(rt,t) ; 当 b==true 时 用 o1 作 
为 内 存 序 ; 当 b==false 时 用 o2 作为 内 存 序 

b=x.compare_exchange_weak(rt,t) ; 用 order 作 为 内 存 序 
( 见 iso.29.6.1[21]) 


b=x.compare_exchange_weak(rt,t,01,02) 


b=x.compare_exchange_weak(rt,t,order) 


b=x.compare_exchange_strong(rt,t,01,02) 类 似 b=x.compare_exchange_weak(rt,t,o1,02) 
b=x.compare_exchange_strong(rt,t,order) 类 似 b=x.compare_exchange_weak(rt,t,order) 
b=x.compare_exchange_strong(rt,t) 类 似 b=x.compare_exchange_weak(rt,t) 


atomic 没有 拷贝 或 移动 操作 。 赋 值 运算 符 和 构造 函数 接受 包含 类 型 T 的 值 并 访问 包含 值 。 

默认 的 atomic (不 用 显 式 的 人}) 是 未 初始 化 的 ， 从 而 可 与 C 标准 库 兼 容 。 

is_lock_free() 操作 可 用 来 检测 这 些 操作 是 否 可 无 锁 执行 或 者 是 否 已 用 锁 实现 。 在 所 有 
主要 C++ 实现 中 ，is_lock_free() 对 整数 和 指针 类 型 都 是 返回 true。 

atomic 特性 是 为 可 映射 到 简单 内 置 类 型 的 类 型 设计 的 。 若 类 型 T 的 对 象 很 大 ， 则 
atomic<T> 就 可 能 用 锁 实 现 。 模 板 参数 T 必须 是 可 简单 拷贝 的 (必须 没有 用 户 自 定义 拷贝 操作 )。 

atomic 变量 的 初始 化 不 是 原子 操作 ， 因 此 初始 化 操作 可 能 与 来 自 其 他 线程 的 访问 操作 
之 间 产 生 数 据 竞争 ( 见 iso.29.6.5 ) 。 但 是 ， 与 初始 化 操作 产生 数据 竞争 的 情况 很 难 出 现 。 因 
此 可 照例 保持 非 局 部 对 象 初始 化 的 简单 性 并 优先 选择 用 常量 表达 式 进行 初始 化 〈 在 程序 启动 
之 前 你 不 可 能 产生 数据 竞争 ) 。 

一 个 简单 的 atomic 变量 对 共享 计数 器 (如 一 个 共享 数据 结构 的 使 用 计数 ) 而 言 非常 接 
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近 理 想 。 例 如 : 


template<typename T> 
class shared_ptr { 
public: 

lf 

“shared_ptr() 

{ 


if (-—*puc) delete p; 


Py p; /指向 共享 对 象 的 指针 
atomic<int>* puc; /指向 使 用 计数 的 指针 

}; 
在 本 例 中 ，*puc 是 一 个 atomic (由 shared_ptr 构造 函数 在 某 处 分 配 )， 从 而 递减 操作 ( --) 
是 原子 操作 ， 当 thread 销毁 一 个 shared_ptr 时 会 正确 报告 新 值 。 

比较 交换 操作 的 第 一 个 参数 〈 表 中 的 rt) 是 一 个 引用 ， 使 得 操作 在 无 法 更 新 其 目标 对 象 
( 表 中 的 x) 时 可 更 新 rt 所 引用 的 对 象 。 

compare_exchange_strong() 和 compare_exchange_weak() 的 区 别 在 于 弱 交 换 版 本 可 
能 因为 “虚假 理由 ”而 失败 。 也 就 是 说 ， 即 使 x.val==rt， 某 些 奇怪 的 机 器 特性 或 x.compare _ 
exchange_weak(rt,t) 的 实现 方式 也 可 能 导致 操作 失败 。 人 允许 这 种 失败 令 compare_ 
exchange_weak() 可 在 compare_exchange_strong() 可 能 很 困难 或 代价 相对 较 高 的 体系 结 
构 上 实现 。 

经 典 比较 交换 循环 可 编写 如 下 : 

atomic<int> val = 0; 

Im expevted = val.load(); 儿 读 取 当 前 值 

dof{ 

int next = fct(expected); // 计算 新 值 

} while (!val.compare_exchange_weak(expected,next)); // 将 next 写 入 val 或 expected 
原子 操作 val.compare_exchange_weak(expected,next) 读 取 val 的 当前 值 并 将 其 与 
expected 进行 比较 ; 若 相 等 ， 将 next 写 入 val。 如 果 某 个 其 他 线程 在 我 们 读 取 val 之 后 准 
备 更 新 之 前 修改 了 它 ， 我 们 就 必须 重 试 。 当 我 们 重 试 时 ,使 用 的 是 从 compare_exchange_ 
weak() 得 到 的 expected 的 新 值 。 最 终 ， 期 望 值 会 被 写 人 。expected 的 值 表示 “ val 被 本 线 
程 所 看 到 的 当前 值 ”。 因 此 ， 由 于 在 每 次 compare_exchange_weak() 执行 时 expected 已 
被 更 新 为 当前 值 ， 我 们 不 会 陷入 无 限 循 环 。 

compare_exchange_strong() 这 类 操作 更 广为人知 的 名 字 是 比较 交换 操作 ( compare- 
and-swap，CAS 操作 )。 所 有 CAS 操作 (在 所 有 语言 中 以 及 在 所 有 机 器 上 ) 有 一 个 可 能 很 严 
重 的 问题 一 一 ABA 问题 。 考 虑 一 个 非常 简单 的 无 锁 单 向 链表 ， 若 data 的 值 小 于 其 头 结 点 的 
data 值 ， 则 在 其 头 部 添加 一 个 新 结 点 : 


extern atomic<Link*> head; 儿 链表 的 共享 头 指针 
Link* nh = new Link(data,nullptr); /创建 一 个 节点 插入 到 链表 中 
Link* h = head.load(); 儿 读 取 链 表 的 共享 头 结 点 
dot{ 
if (h->data<data) break:; 儿 车 为 真 ， 插入 到 其 他 位 置 
nh->next = h; 咱 下 一 个 元 素 为 旧 头 结 点 


} while (ihead.compare_exchange_weak(h,nh)); ”// 将 nh 写 入 head 或 h 
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这 是 一 个 在 有 序 链表 中 正确 插入 data 的 简化 版 代码 。 我 读 取 head， 将 其 用 作 我 的 新 Link 
的 next， 然 后 将 指向 我 的 新 Link 的 指针 写 入 head。 重 复 这 一 过 程 ， 直 至 在 我 准备 nh 期 间 
没有 其 他 线程 改变 head。 

让 我 们 更 详细 地 观察 一 下 这 段 代 码 。 用 A 表示 我 读 取 的 head 值 。 如 果 在 我 执行 
compare_exchange_weak() 之 前 没有 其 他 线程 改变 head 的 值 ， 则 它 得 到 head 中 的 A， 
并 成 功 将 其 替换 为 我 准备 好 的 nh。 如 果 某 个 其 他 线程 在 我 读 取 A 之 后 将 head 的 值 修改 为 
B，compare_exchange_weak() 调用 将 失败 ， 我 将 继续 执行 循环 ， 在 此 读 取 head。 

这 看 起 来 是 正确 的 。 哪 里 可 能 会 出 错 呢 ? 在 我 读 取 A 之 后 ， 某 个 其 他 线程 将 head 的 值 
修改 为 B， 并 回收 了 Link。 随 后 ， 某 个 线程 重用 节点 A 并 将 其 重新 插入 到 链表 的 head。 现 
在 我 调用 compare_exchange_weak() 会 得 到 A 并 执行 更 新 。 但 是 ， 链 表 已 经 被 修改 了 : 
head 值 从 A 变 为 B 然后 又 变 回 A。 这 种 改变 的 严重 性 可 能 体现 在 不 同方 面 ， 在 这 个 简化 的 
例子 中 ，A->data 可 能 已 改变 ， 从 而 关键 的 data 比较 会 出 错 。ABA 问题 可 能 非常 微妙 且 难 
以 检测 。 已 有 很 多 方法 可 以 处 理 ABA 问题 [Dechev, 2010]。 我 在 这 里 提出 这 个 问题 主要 是 
警告 你 : 无 锁 编程 是 很 微妙 的 。 

整数 atomic 类 型 提供 了 原子 算术 运算 和 位 运算 : 


整 型 TT 的 atomic<T> (iso.29.6.3 ) 
x.val 表示 原子 对 象 x 的 值 ; 所 有 操作 都 是 noexcept 的 


z=x.fetch_add(y) x.val+=y; zZ 是 x.val 的 旧 值 
z=x.fetch_add(y,order) z=x.fetch_add(y); 用 order 作为 内 存 序 
z=x.fetch_subl(y) x.val-=y; zZ 是 x.val 的 旧 值 
z=x.fetch_sub(y,order) z=x.fetch_sub(y); 用 order 作为 内 存 序 
z=x.fetch_and(y) x.val&=y; zZ 是 x.val 的 旧 值 
z=x.fetch_and(y,order) z=x.fetch_and(y); 用 order 作为 内 存 序 
z=x.fetch_or(y) x.val|=y; z 是 x.val 的 旧 值 
z=x.fetch_or(y,order) z=X.fetch_or(y); 用 order 作为 内 存 序 
z=x.fetch_xor(y) x.val^=y; z 是 x.val 的 旧 值 
z=x.fetch_xor(y,order) z=Xx.fetch_xor(y); 用 order 作为 内 存 序 
++X ++X.Val; 返回 x.val 

X++ XxX.val++; 返回 旧 x.val 

--X --X.Val; 返回 x.val 

X-- x.val--; 返回 旧 x.val 

x+=y x.val+=y; 返回 x.val 

x-=y Xx.val-=y; 返回 x.val 

x&=y Xx.val&=y; 返回 x.val 

x|=y x.vall=y; 返回 x.val 

x^=y x.val^=y; 返回 x.val 


考虑 流行 的 双重 检查 锁 范 型 。 其 基本 思想 是 ， 如 果 初 始 化 某 个 x 必须 借助 锁 来 进行 ， 那 么 每 
次 访问 x 都 可 能 需要 请 求 此 锁 来 检测 初始 化 是 否 完成 ， 但 你 不 想 承 受 这 种 代价 ， 可 以 仅 当 变 
量 x_init 为 false 时 才 使 用 锁 并 进行 初始 化 : 


Xx; 儿 我 们 需要 一 个 锁 帮 助 初始 化 义 
mutex Ix; /1 mutex 用 来 在 初始 化 期 间 锁 住 x 
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atomic<bool> x_init {false}; 外 用 一 个 atomic 最 小 化 锁 的 使 用 


void some_code() 


if (1x_init) { 咱 若 x 未 初始 化 ， 继 续 执 行 
lx.lock(); 
if (lx_init) { 外 若 x 仍 未 初始 化 ， 继 续 执行 
/1 .初始 化 x… 
x_init = true; 
} 
Ix.uniock(); 
和 
1 使 用 X。 


} 
假如 x_init 不 是 atomic， 指 令 重 排 机 制 就 有 可 能 将 x 的 初始 化 放 在 检测 x_init 之 前 ， 因 为 两 
者 显然 是 无 关 的 ( 见 41.2.2 节 )。 而 将 x_init 定义 为 原子 变量 就 能 阻止 重 排 。 

!x_init 依赖 于 从 atomic<T> 到 下 的 隐 式 转换 。 

这 段 代码 可 以 利用 RAII ( 见 42.3.1.4 节 ) 进一步 简化 。 

双重 检查 锁 范 型 在 标准 库 中 用 once_flag 和 call_once() ( 见 42.3.3 节 ) 表示 ， 因 此 你 无 
需 直 接 编 写 这 种 代码 。 

标准 库 还 支持 atomic 指针 : 


指针 的 atomic<T*> (iso.29.6.4 ) 
x.val 表示 原子 对 象 x 的 值 ; 所 有 操作 都 是 noexcept 的 








z=x.fetch_add(y) x.val+=y; zZ 是 x.val 的 旧 值 
z=x.fetch_add(y,order) z=x.fetch_add(y); 用 order 作为 内 存 序 
z=x.fetch_sub(y) x.val-=y; zZ 是 x.val 的 旧 值 
z=x.fetch_subl(y,order) z=xXx.fetch_sub(y); 用 order 作为 内 存 序 
++X ++X.val; 返回 x.val 

X++ x.val++; 返回 旧 x.val 

--X --X.Vval; 返回 x.val 

X-- X.Val--; 返回 | 日 x.val 

x+=y x.val+=y; 返回 x.val 

Xx-=y x.val-=y; 返回 x.val 


为 了 与 C 标准 库 保持 兼容 ， 标 准 库 还 为 atomic 成 员 函 数 类 型 提供 了 独立 的 等 价 版 本 : 


atomic_* 操作 (iso.29.6.5 ) 


所 有 操作 都 是 noexcept 的 
atomic_is_lock_free(p) *p 类 型 对 象 是 原子 的 吗 ? 
atomic_init(p,v) 用 v 初始 化 *p 
atomic_store(p,v) 将 v 存 人 *p 
x=atomic_load(p) 将 *p 赋予 x 
x=atomic_load(p) 加 载 *p 存 人 Xx 
b=atomic_compare_exchange_ weak(p,q,v) 比较 交换 *p 和 *q; b=(*q==v) 


… 还 有 大 约 70 个 函数 
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41.3.2 标志 和 栅栏 


除了 支持 原子 类 型 之 外 ， 标 准 库 还 提供 了 两 种 更 低层 的 同步 特性 : 原子 标志 和 栅栏 。 它 
们 的 主要 用 途 是 实现 最 底层 的 原子 特性 ， 如 自 旋 锁 和 原子 类 型 。 这 两 个 特性 是 仅 有 的 每 个 
C++ 实现 都 保证 支持 的 无 锁 机 制 (虽然 所 有 主流 平台 也 都 支持 原子 类 型 )。 

基本 上 没有 程序 员 需 要 使 用 标志 或 栅栏 。 其 使 用 者 通常 是 和 硬件 设计 师 紧密 合作 的 人 。 
41.3.2.1 atomic 标志 

atomic_flag 是 最 简单 的 原子 类 型 ， 也 是 仅 有 的 所 有 操作 在 任何 C++ 实现 中 都 保证 是 原 
子 操作 的 原子 类 型 。 一 个 atomic_flag 表示 一 条 单一 位 信息 。 如 需要 ， 可 用 atomic _flag 实 
现 其 他 原子 类 型 。 

atomic_flag 有 两 个 可 能 值 ， 分 别称 为 set 和 clear。 


atomic flag (iso.29.7 ) 





所 有 操作 都 是 noexcept 的 
atomic_flag fi; fl 的 值 未 定义 
atomic flag fl {}; 默认 构造 函数 ; ff 的 值 为 0 
atomic_flag fl {AT OMIC_FLAG_INIT}; 将 有 1 初 始 化 为 clear 
b=fl.test_and_set() 设置 f，b 为 和 的 旧 值 
b=fl.test_and_set(order) 设置 f，b 为 的 旧 值 ， 用 order 作为 内 存 序 
fl.clear() 清除 中 
fl.clear(order) 清除 fj; 用 order 作为 内 存 序 
b=atomic flag_test_and_set(fip) 设置 *flp，b 为 *flp 的 旧 值 
b=atomic flag_test_and_set_explicit(flp,order) 设置 *flp,b 为 *flp 的 旧 值 ; 用 order 作为 内 存 序 
atomic flag_clear(flp) 清除 *flp 
atomic flag_clear_explicit(flp,order) 清除 *flp; 用 order 作为 内 存 序 


设置 操作 的 bool 返回 值 为 true， 清 除 操 作 返 回 false。 
用 人 初始 化 atomic_flag 看 起 来 是 合理 的 。 但 是 ,我 们 无 法 保证 0 表示 清除 。 据 说 存在 
用 1 表示 清除 的 机 器 。 用 ATOMIC_FLAG_INIT 表示 清除 是 初始 化 atomic_flag 的 唯一 可 移 
植 且 可 靠 的 方法 。ATOMIC_FLAG_INIT 是 由 具体 C++ 实现 提供 的 宏 。 
可 以 将 atomic_flag 想象 为 一 种 非常 简单 的 自 旋 锁 : 
class spin_mutex { 
atomic flag flag = ATOMIC FLAG INIT; 
public: 
void lock() { while(flag.test_and_ set()); } 
void unlock() { flag.clear(); } 
}; 
注意 ， 自 旋 锁 容易 产生 很 高 的 代价 。 
照例 ， 内 存 序 及 其 正确 使 用 请 见 专业 文献 。 
41.3.2.2 ”栅栏 
栅栏 (fence)， 也 称 为 内 存 屏障 (memory barrier)， 是 一 种 根据 某 种 指定 内 存 序 ( 见 
41.2.3 节 ) 来 限制 操作 重 排 的 操作 ， 除 此 之 外 不 做 任何 其 他 事情 。 你 可 以 将 其 看 作 一 种 简单 
地 减 慢 程序 到 安全 速度 的 方法 ， 从 而 令 内 存 层次 达到 定义 良好 的 合理 状态 。 
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栅栏 (iso.29.8 ) 
所 有 操作 都 是 noexcept 的 
atomic_thread_fence(orden) 强制 内 存 序 为 order 
atomic_signal_fence(order) 强制 内 存 序 为 order， 用 于 线程 以 及 运行 于 线程 上 的 信号 处 理 函 数 


栅栏 与 atomic 组 合 使 用 (atomic 用 来 观察 栅栏 的 效果 )。 


41.4 volatile 
说 明 符 volatile 用 来 指出 一 个 对 象 可 被 线程 控制 范围 之 外 的 东西 修改 。 例 如 : 


volatile const long clock_register; // 由 硬件 时 钟 更 新 
volatile 说 明 符 主要 是 告知 编译 器 不 要 优化 掉 明 显 宛 余 的 读 写 操作 。 例 如 : 


auto t1 {clock_register}; 

咱 ... 未 使 用 clock_register 的 代码 … 

auto t2 {clock_register}); 
如 果 clock_register 不 是 定义 为 volatile 的 ， 编 译 右 完全 有 权利 删除 一 个 读 操作 并 假定 
t1==t2。 

除非 是 在 直接 处 理 硬件 的 底层 代码 中 ， 否 则 不 要 使 用 volatile。 

不 要 假定 volatile 在 内 存 模型 中 有 特殊 含义 ， 它 确实 没有 。 与 某 些 新 语言 不 同 ， 在 C++ 
中 volatile 并 非 一 种 同步 机 制 。 为 了 进行 同步 ， 应 使 用 atomic ( 见 41.3 节 )、mutex ( 见 
42.3.1 节 ) 或 condition_variable ( 见 42.3.4 节 )。 


41.5 建议 


] 用 并 发 提高 响应 能 力 或 吞吐 率 ; 41.1 节 。 

只 要 代价 可 接受 ， 应 在 尽 可 能 高 的 抽象 层次 上 编程 ; 41.1 节 。 

优先 选择 packaged_task 和 future ， 而 不 是 直接 使 用 thread 和 mutex; 41.1 节 。 
] 除非 是 实现 简单 计数 器 ， 和 否则 优先 选择 mutex 和 condition_variable， 而 不 是 直 
接 使 用 atomic; 41.1 节 。 

[5] 尽量 避免 显 式 共 享 数 据 ; 41.1 节 。 

[6] 将 进程 视 为 线程 的 替代 ; 41.1 节 。 

[7] 标准 库 并 发 特性 是 类 型 安全 的 ; 41.1 节 。 

[8 ] 内 存 模型 是 为 了 省 去 程序 员 从 机 器 体系 结构 层次 思考 计算 机 的 麻烦 ; 41.2 节 。 

[ 9] 内 存 模型 令 内 存 行为 大 致 如 我 们 的 朴素 预期 ;41.2 节 。 

[ 10 ] 不 同 线程 访问 一 个 struct 的 不 同位 域 可 能 相互 干扰 ; 41.2 节 。 

[ 11 ] 避免 数据 竞争 ; 41.2.4 节 。 

[ 12 ] 原子 类 型 和 操作 可 实现 无 锁 编 程 ; 41.3 节 。 

[ 13 ] 无 锁 编 程 对 避免 死 锁 和 确保 每 个 线程 持续 前 进 是 很 重要 的 ; 41.3 节 。 

[14] 将 无 锁 编 程 留 给 专家 ; 41.3 。 

] 将 放松 内 存 模 型 留 给 专家 ; 41.3 节 。 

[16] volatile 告知 编译 器 一 个 对 象 的 值 可 以 被 程序 之 外 的 东西 改变 ; 见 41.4 节 。 

] C++ 的 volatile 不 是 一 种 同步 机 制 ; 见 41.4 节 。 
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线程 和 任务 





保持 冷静 ， 继 续 前 进 。 





英语 口号 


e 引言 

。 线程 
身份 ; 构造 ; 析 构 ; join(); detach(); 名 字 空 间 this_thread; 杀 死 thread; thread_ 
local 数据 

e 避免 数据 竞争 
互 斥 量 ; 多 重 锁 ; call_once (); 条 件 变量 

e 基于 任务 的 并 发 
future 和 promise ; promise ; packaged _ task ; future ; shared future ; async() ; 
一 个 并 行 find() 示例 

e 建议 


42.1 引言 


并 发 ， 即 多 个 任务 同时 执行 ,广泛 用 于 提高 吞吐 率 〈 使 用 多 个 处 理 器 完成 单个 运算 ) 或 
提高 响应 能 力 ( 当 程序 的 一 部 分 等 待 响 应 时 允许 另 一 部 分 继续 执行 )。 

我 们 在 5.3 节 中 已 经 介绍 了 C++ 标准 对 并 发 的 支持 ， 当 然 只 是 一 种 导 览 的 形式 ， 本 章 
和 前 一 章 提 供 更 加 细致 、 更 加 系统 化 的 介绍 。 

如 果 一 项 活动 可 能 与 其 他 活动 并 发 执行 ,我 们 就 称 之 为 任务 〈task)。 线 程 (thread) 是 
执行 任务 的 计算 机 特性 的 系统 层面 表示 。 一 个 thread 可 执行 一 个 任务 。 一 个 thread 可 能 与 
其 他 thread 共享 地 址 空间 。 即 ， 在 单一 地 址 空间 中 的 所 有 thread 能 访问 相同 的 内 存 位 置 。 
并 发 系统 程序 员 所 面临 的 重要 挑战 之 一 ， 就 是 确保 多 thread 并 发 访问 内 存 的 方式 是 合理 的 。 


42.2 线程 


thread 是 计算 的 概念 在 计算 机 硬件 层面 的 抽象 。C++ 标准 库 thread 的 设计 目标 是 与 操 
作 系 统 线程 形成 一 对 一 映射 。 当 程序 中 多 个 任务 需要 并 发 进行 时 ， 我 们 就 可 以 使 用 thread。 
在 一 个 多 处 理 单元 (“核心 ”) 的 系统 上 ，thread 可 以 充分 利用 这 些 单元 。 所 有 thread 工作 
于 同一 个 地 址 空间 中 。 如 果 你 希望 硬件 能 防止 数据 竞争 ， 则 应 使 用 进程 。thread 间 不 共享 
栈 ， 因 此 局 部 变量 不 会 产生 数据 竞争 问题 ， 除 非 你 不 小 心 将 一 个 局 部 变量 的 指针 传递 给 其 他 
thread。 我 们 要 特别 小 心 lambda 中 的 引用 方式 的 上 下 文 绑 定 ( 见 11.4.3 节 )。 深 思 熟 虑 地 、 
小 心地 共享 栈 内 存 空间 很 有 用 ， 也 很 常见 。 例 如 ， 我 们 可 能 将 一 个 局 部 数组 的 不 同 部 分 传递 
给 一 个 并 行 排序 函数 。 

如 果 一 个 thread 不 能 继续 前 进 〈 比 如 ， 因 为 它 遇 到 了 一 个 其 他 thread 所 拥有 的 mutex)， 
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我 们 称 它 处 于 阻塞 (blocked) 或 睡眠 (asleep) 状态 。 


id 


native_handle_type 
thread t {}; 默认 构造 极 数 : 创建 一 个 (还 ) 没有 任务 的 thread; 不 抛 出 异常 

thread t {t2}; 
thread t {f,args}; 
tthread(); 
t=move(t2) 
t.swap(t2) 
t.joinable() 


t.join() 


t.detach() 
x=t.get_id() 
x=t.native_handle() 


n=hardware_concurrency() 


swaplt,t2) 


thread (iso.30.3.1 ) 
thread 标识 符 类 型 
系统 线程 句柄 类 型 ;由 具体 C++ 实现 定义 (iso.30.2.3 ) 





移动 构造 函数 ; 不 抛 出 异常 

构造 函数 ; 在 一 个 新 thread 上 执行 f(args); 显 式 构造 函数 

析 构 函数 ; 若 tjoinable()， 则 terminate(); 否则 无 效果 

移动 赋值 : 若 tjoinable()， 则 terminate(); 不 抛 出 异常 

交换 t 和 t2 的 值 ; 不 抛 出 异常 

某 个 线程 的 执行 与 t 关 联 ? t.get_id()!=idf} ?; 不 抛 出 异常 

将 t 与 当前 线程 结合 ; 即 ， 阻 塞 当前 thread 直至 t 完 成 ; 若 检测 到 死 锁 ， 抛 





出 system_error (如 t.get_id()==this_thread::get_id()); 若 t.id==idf}， 抛 出 
system_error 


确保 t 不 再 表示 任何 系统 线程 ; 若 t.id!=id{} 抛 出 system_error 
x 为 t 的 id; 不 抛 出 异常 

x 为 t 的 本 机 句柄 (类 型 为 native_handle_type) 

n 为 硬件 处 理 单元 数 (0 表示 “不 知道 ”); 不 抛 出 异常 
t.swap(t2) ; 不 抛 出 异常 


一 个 thread 表示 一 个 系统 资源 ， 一 个 系统 线程 (system thread)， 甚 至 可 能 有 专用 硬件 : 


thread 





系统 线程 


因此 ，thread 可 以 移动 但 不 能 拷贝 。 
作为 一 个 源 被 移动 后 ,thread 就 不 再 表示 一 个 计算 线程 了 。 特 别 是 ， 它 不 能 被 join() 了 。 
操作 thread::hardware_concurrency() 报告 硬件 支持 多 少 个 任务 同时 执行 。 其 具体 含 
义 依赖 于 机 器 体系 结构 ， 但 通常 小 于 操作 系统 提供 的 线程 数 ( 例 如 ， 通 过 时 间 多 路 复 用 或 时 
间 分 片 )， 有 时 大 于 处 理 器 数 或 “核心 数 ” 。 例 如 ， 我 的 双核 小 笔记 本 报告 有 四 个 硬件 线程 
( 它 使 用 了 超 线程 (hyper-threading) 技术 )。 


42.2.1 


身份 


每 个 执行 线程 都 有 唯一 标识 符 ， 用 thread::id 类 型 的 值 表示 。 如 果 一 个 thread 不 表示 
一 个 执行 线程 ， 则 其 id 为 默认 的 idf}。 一 个 thread t 的 id 可 以 通过 调用 t.get_id() 获得 。 
当前 thread 的 id 可 通过 this_thread::get_id() 获得 ( 见 42.2.6 节 )。 
在 下 列 情况 下 ， 一 个 thread 的 id 可 以 是 idf}: 
它 并 未 被 赋予 一 个 任务 ; 


它 已 结束 ; 
它 已 被 移动 ; 
它 已 被 detach()。 


人 第 条 茧 线程 和 和 企 和 大 295 





每 个 thread 都 有 一 个 id， 但 一 个 系统 线程 仍 可 以 在 没有 id 的 情况 下 运行 ( 即 ,detach() 之 后 )。 
thread::id 可 以 拷贝 ， 且 id 可 用 常用 的 比较 运算 符 (==、< 等 ) 进行 比较 、 用 << 输出 
以 及 用 特例 化 版 本 hash<thread::id> 计算 哈 希 值 ( 见 31.4.3.4 节 )。 例 如 : 
void print_id(thread& t) 


{ 
if (t.get_id()==id{}) 
cout << "t not joinable\n"; 
else 
cout << "t's id is " << t.get id() << "\n'; 
} 


注意 ，cout 是 一 个 全 局 共享 对 象 ， 因 此 这 些 输出 语句 不 保证 生成 可 辨认 的 字符 序列 ， 除 非 
你 确认 没有 两 个 thread 同时 向 cout 写 数 据 ( 见 iso.27.4.1 节 )。 
42.2.2 ”构造 


thread 的 构造 函数 接受 一 个 要 执行 的 任务 ， 以 及 该 任务 要 求 的 参数 。 参 数 的 数量 和 类 
型 必须 与 任务 所 要 求 的 参数 列表 匹配 。 例 如 : 

void f0(); J 无 参数 

void f1(int); 川 一 个 int 参数 


thread t1 {f0}; 


thread t2 {f0,1}; 儿 错误 : 大 多 参数 
thread t3 {f1}; // 错误 : 太 少 参数 
thread t4 {f1,1}; 

thread t5 {f1,1,2}; 1 错误 : 太 多 参数 


thread t3 {f1,"I'm being silly"}; /| 错误 : 参数 类 型 错误 
thread 构造 完毕 之 后 ,一 旦 运行 时 系统 能 获取 它 运 行 所 需 的 资源 ， 它 就 开始 执行 任务 。 你 
可 以 认为 这 个 过 程 是 “立即 地 ”。 并 不 存在 单独 的 “启动 thread ”操作 。 

如 果 你 希望 构建 一 组 任务 ， 将 它们 链接 在 一 起 〈 例 如， 通过 消息 队列 进行 通信 )， 你 应 
首先 将 任务 构造 为 函数 对 象 ， 然 后 ， 在 它们 就 绪 之 后 启动 thread。 例 如 : 

template<typename T> 


class Sync_queue<T> { /| 一 个 队列 ， 提 供 put() 和 get()， 无 数据 竞争 ( 见 42.3.4 节 ) 
1/ 


}»; 


struct Consumer { 
Sync_queue<Message>& head; 
Consumer(Sync_queue<Message>& q) :head(q) {} 
void operator()(); /从 head 获取 消息 

}; 


struct Producer { 
Sync_queue<Message>& tail; 
Consumer(Sync_queue<Message>& q) :tail(q) 分 
void operator()(); /将 消息 放 到 tail 
}; 
Sync_queue<Message> mq; 
Consumer c {mq}; 咱 创 建 任务 并 将 它们 “ 串 在 一 起 ” 
Producer p {maq)}; 


thread pro {p}; 儿 最 终 : 启动 线程 
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thread con {c); 


0 a 
试图 将 thread 的 创建 与 要 运行 的 任务 间 的 连接 设置 混杂 在 一 起 ， 很 容易 让 程序 变 得 复杂 
易 错 。 

thread 的 构造 函数 是 可 变 参 数 模板 ( 见 28.6 节 )。 这 意味 着 为 了 传递 给 thread 构造 函 
数 一 个 引用 ， 我 们 必须 使 用 引用 包装 ( 见 33.5.1 节 )。 例 如 : 


void my_task(vector<double>& arg); 


void test(vector<double>& v) 





{ 
thread my_thread1 {my_task,v}; 儿 糟糕 : 传递 了 v 的 拷贝 
thread my_thread2 {my_task,ref(v)}; 外 正确 : 以 引用 方式 传说 Vv 
thread my_thread3 {[&v]{ my_task(v); }}; // 正确 : 躲 开 了 引用 问题 
Hs 

} 


问题 在 于 可 变 参数 模板 使 用 bind() 或 其 他 等 价 机 制 ， 因 此 默认 情况 会 对 引用 进行 解 引用 操 
作 ， 其 结果 被 拷贝 。 因 此 ， 如 果 v 为 {12,3} 且 my _task 递增 元 素 ， 则 my_thread1 不 会 对 v 
产生 任何 效果 。 注 意 ，3 个 thread 会 产生 vV 上 的 数据 竞争 ; 这 个 例子 只 是 说 明正 确 的 调用 规 
范 ， 而 非 展示 好 的 并 发 编程 风格 。 

一 个 默认 构造 的 thread 主要 用 作 移 动 操 作 的 目标 。 例 如 : 

vector<thread> worker(1000); // 1000 个 默认 线程 

for (int i=0; i!=worker.size(); ++i) { 


儿 .… 计算 worker[i] 的 参数 并 创建 工作 线程 tmp … 


worker[i] = move(tmp); 


} 
将 任务 从 一 个 thread 移动 到 男 一 个 thread 并 不 影响 其 执行 ，thread 的 移动 只 是 改变 thread 
指向 的 是 什么 。 


42.2.3” 析 构 


显然 ，thread 的 析 构 函数 销毁 thread 对 象 。 为 了 防止 发 生 系 统 线程 的 生命 期 长 于 其 
thread 的 意外 情况 , thread 析 构 函数 调用 terminate() 结束 程序 ( 若 thread 是 joinable() 的 ， 
即 get_id()!=id{})。 例 如 : 

void heartbeat() 


while(true) { 
output(steady_clock::now!()); 
this_thread::sleep_for(second{1}); // 见 42.2.6 节 


} 
void run() 


thread t {heartbeat}; 
} 1/ 由 于 在 t 的 作用 域 结束 时 heartbeat() 仍 在 运行 ， 因 此 结束 它 


如 果 你 真 的 希望 一 个 系统 线程 在 其 thread 的 生命 期 结束 后 仍然 继续 运行 ， 请 参考 42.2.5 节 。 
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42.2.4 join() 
tjoin() 告诉 当前 thread 在 t 结 束 之 前 不 要 继续 前 进 。 例 如 : 
void tick(int n) 
for (int i=0; il=n; ++i) { 


this_thread::sleep_for(second{1}); // § 42.2.6 
output("Alive!"); 


} 

} 

int main() 

{ 
thread timer {tick,10}; 
timer.join(); 


这 段 代 码 会 以 大 约 1 秒 的 时 间 间 隔 连续 输出 10 次 Alive!。 假 如 漏 掉 了 timer.join()， 程 序 会 
在 tick() 打印 出 任何 内 容 之 前 就 结束 ， 而 join() 令 主 程序 等 待 timer 结束 。 
如 42.2.3 节 所 述 ， 试 图 不 调用 detach() 而 让 一 个 thread 在 其 作用 域 后 (或 更 一 般 的 ， 
在 其 析 构 函数 运行 后 ) 继续 执行 ， 会 被 认为 是 一 个 (对 程序 而 言 的 ) 致命 错误 。 但 是 ， 我们 
可 能 忘记 join() 一 个 thread。 当 我 们 将 一 个 thread 看 作 一 个 资源 ， 就 会 发 现 应 该 考虑 RAII 
( 见 5.2 节 和 13.3 节 )。 考 虑 一 个 简单 的 测试 程序 : 
void run(inti, int n) // 警告 : 真正 糟糕 的 代码 
{ 
thread t1 {f}; 
thread t2; 
vector<Foo> v; 
hsss 
if (i<n) { 
thread t3 {9}; 
| 
t2 = move(t3); /将 包 移 到 外 层 作 用 域 


} 
Vv 四 =Foof}; /可 能 抛 出 异常 
lss 
t1.join(); 
t2.join(); 
} 
在 这 段 代 码 中 ， 我 犯 了 几 个 严重 错误 。 特 别 是 : 
e 我 们 可 能 永远 也 到 达 不 了 末尾 的 两 个 join()。 在 此 情况 下 , t1 的 析 构 函 数 会 结束 程序 。 
e 我 们 可 能 在 未 执行 移动 操作 t2 = move(t3) 的 情况 下 到 达 未 尾 的 两 个 join()。 在 此 情 
况 下 ，t2.join() 会 结束 程序 。 
对 这 种 使 用 thread 的 方式 ,我 们 需要 一 个 隐 式 调用 join() 的 析 构 函数 。 例 如 : 


struct guarded thread : thread { 
using thread::thread; 儿 见 20.3.5.1 节 
“guarded thread() { if (t.joinable()) t.join(); } 

}; 


不 幸 的 是 ，guarded_thread 不 是 一 个 标准 库 类 ， 但 它 遵循 RAII 的 优良 传统 ， 令 我 们 的 代码 
更 简洁 也 更 不 容易 出 错 。 例 如 : 
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void run2(int i, int n) 川 守卫 机 制 的 简单 使 用 
{ 
guarded thread t1 {f}; 
guarded thread t2; 
vector<Foo> v; 
1 
if (i<n) { 
thread t3 {g}; 
1 
t2 =move(t3); // 将 13 移 到 外 层 作用 域 
} 
v[] = Foo{}; 。 /1/ 可 能 抛 出 异常 
Hl 


} 

那么 为 什么 thread 的 析 构 函数 不 这 样 简单 调用 一 下 join() 呢 ? 因为 使 用 “永远 活跃 ”的 系 
统 线程 或 自己 决定 何 时 结束 的 系统 线程 是 由 来 已 久 的 传统 。 执 行 tick() 的 timer( 见 42.2.2 节 ) 
就 是 这 种 线程 的 例子 。 还 有 很 多 监控 数据 结构 的 线程 也 能 提供 这 样 的 例子 。 这 种 线程 (或 进 
程 ) 通常 被 称 为 守护 进程 (daemon)。 分 离线 程 的 另 一 种 用 法 是 简单 地 启动 一 个 线程 去 完成 
一 个 任务 ， 然 后 忘记 它 ， 这 将 “内 务 管 理 ” 交 给 了 运行 时 系统 。 


42.2.5 detach() 


意外 地 令 thread 在 析 构 函数 执行 后 仍 试图 继续 运行 被 认为 是 一 个 非常 糟糕 的 错误 。 如 
果 你 真 的 希望 一 个 系统 线程 比 其 thread (句柄 ) 活跃 更 久 ， 应 使 用 detach()。 例 如 : 


void run2() 
{ 

thread t {heartbeat}; 

t.detach(); 儿 念 heartbeat 独立 运行 
} 


对 分 离 的 线程 我 有 一 个 哲学 上 的 问题 。 如 果 让 我 选择 ， 我 会 选 

e 确切 了 解 哪 些 线 程 在 运行 ; 

。 能 确定 线程 是 否 正在 如 预期 继续 执行 ; 

能 检查 应 该 删除 自己 的 线程 是 否 真 的 这 么 做 了 ; 
能 了 解 使 用 线程 返回 的 结果 是 否 安全 ; 
确保 一 个 线程 所 关联 的 所 有 资源 都 被 释放 ; 

e 确保 一 个 线程 在 其 创建 时 所 在 作用 域 已 被 销毁 时 ， 不 会 试图 访问 此 作用 域 中 的 对 象 。 
除非 我 已 经 超出 了 标准 库 范 围 (如 使 用 native_handle() 和 “原始 ”系统 特性 )， 和 否则 是 不 能 
对 分 离 的 线程 实现 上 述 目标 的 。 而 且 ， 当 分 离线 程 无 法 被 直接 观测 时 ， 我 该 如 何 调试 系统 
呢 ? 如 果 一 个 分 离线 程 保 存 了 其 创建 作用 域 中 的 对 象 的 指针 ， 又 会 发 生 什 么 呢 ? 这 可 能 导致 
数据 损坏 、 系 统 骨 省 或 安全 违规 。 当 然 ， 分 离线 程 显然 可 以 很 有 用 ， 也 可 以 调试 ， 毕 竟 人 们 
这 样 做 已 有 几 十 年 历史 了 。 但 人 们 处 理 具有 自 毁 能 力 对 象 的 历史 已 有 数 百 年 ， 并 且 相 信人 它 们 
是 很 有 用 的 。 如 果 让 我 选择 ， 我 不 会 detach() 线程 。 

注意 ，thread 提供 了 移动 赋值 操作 和 移动 构造 函数 。 这 令 thread 可 以 迁移 出 它 创建 
时 所 在 的 作用 域 ， 从 而 常常 可 作为 detach() 的 替代 方案 。 我 们 可 以 将 thread 迁移 到 程序 
的 “ 主 模块 "， 通 过 unique_ptr 或 shared_ptr 访问 它们 ,或 者 将 它们 放置 于 一 个 容器 中 (如 
vector<thread>)， 免 得 失去 与 它们 的 联系 。 例 如 : 
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vector<thread> my _threads; /| 保存 分 离线 程 


void run() 
{ 
thread t {heartbeat}; 
my_threads.push_back(movel(t)); 
sv 
my_threads.emplace_back(tick,1000); 
} 


void monitor() 


for (thread& t : my_threads) 
cout << "thread " << t.get_id() << "\n’; 


} 
对 于 更 实际 的 例子 ， 我 可 以 为 my_threads 中 的 每 个 thread 关联 一 些 信息 。 我 甚至 可 以 将 
monitor 作为 一 个 任务 启动 。 

如 果 你 必须 detach() 一 个 thread， 请 确保 它 没有 引用 其 作用 域 中 的 变量 。 例 如 : 

void home() /1/ 不 要 这 样 做 


{ 
int var; 
thread disaster{[&]{ this_thread::sleep_ for(second{7.3});++var; }} 
disasterdetach(); 

} 


除了 注释 中 的 警告 和 耐人寻味 的 名 字 之 外 ， 这 段 代 码 看 起 来 完全 无 害 。 但 事实 并 非 如 此 : 
disaster() 调用 的 系统 线程 会 “永远 ”向 home() 分 配给 var 的 地 址 写 和 数据， 从 而 破坏 之 
后 分 配 到 这 里 的 数据 。 这 种 错误 极 难 查找 ， 因 为 显现 错误 的 代码 与 错误 本 身 的 关联 度 很 低 ， 
而 且 重 复 运 行程 序 会 得 到 不 同 的 结果 一 一 很 多 次 运行 可 能 不 会 表现 出 错误 症状 。 这 种 错误 被 
称 为 海 森 堡 错误 (Heisenbugs)， 这 一 名 称 是 向 测 不 准 原理 的 发 现 者 致敬 。 

注意 ， 这 个 例子 的 根本 问题 是 违反 了 广为人知 的 简单 规则 “不 要 将 一 个 局 部 对 象 的 指针 
传递 出 其 作用 域 之 外 ”( 见 12.1.4 节 )。 但 是 ， 使 用 lambda 很 容易 (而且 几乎 是 不 可 见地 ) 创 
建 指向 局 部 变量 的 指针 : [&]。 幸 运 的 是 ， 我 们 必须 使 用 detach() 才能 让 一 个 thread 离开 其 
作用 域 ; 除非 有 非常 好 的 理由 ， 和 否则 不 要 这 么 做 ， 即 使 需要 使 用 detach()， 也 应 首先 仔细 思 
考 thread 的 任务 可 能 做 什么 ， 然 后 再 使 用 。 


42.2.6 ”名 字 空 间 this_thread 
对 当前 thread 的 操作 定义 在 名 字 空 间 this_thread 中 : 


名 字 空 间 this_thread (iso.30.3.1 ) 


x=get_id() x 为 当前 thread 的 id; 不 抛 出 异常 

yield() 给 调度 器 机 会 运行 男 一 个 thread; 不 抛 出 异常 
sleep_until(tp) 令 当 前 thread 进入 睡眠 状态 ， 直 至 time_point tp 
sleep_for(d) 令 当 前 thread 进入 睡眠 状态 ， 持 续 duration d 





为 了 获得 当前 thread 的 身份 ， 可 调用 this_thread::get_id()。 例 如 : 
void helper(thread& t) 
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thread::id me {this_thread::get_id()}; 
ll 


if (t.get_id()!=me) t.join(); 
Wh 
} 


类 似 地 ， 我 们 可 以 用 this_thread::sleep_until(tp) 和 this_thread::sleep_for(d) 令 当 前 线程 
进入 睡眠 状态 。 

this_thread::yield() 用 来 给 其 他 线程 运行 机 会 。 当 前 thread 不 会 被 阻塞 ， 无 需 任 何其 
他 thread 做 任何 特殊 操作 来 唤醒 它 ， 它 最 终 也 会 重新 运行 。 因 此 ，yield() 主要 用 来 等 待 一 
个 atomic 改变 状态 以 及 用 于 协调 多 线程 。 通 常 ， 使 用 sleep_for(n) 会 更 好 。sleep_for() 的 
参数 能 令 调 度 器 更 好 地 合理 选择 运行 哪个 thread。 可 将 yield() 看 作 一 个 在 很 罕见 和 特殊 的 
情况 下 用 来 进行 优化 的 特性 。 

在 所 有 主要 C++ 实现 中 thread 都 是 可 抢占 的 ; 即 ，C++ 实现 可 以 从 一 个 任务 切换 到 另 
一 个 任务 ， 以 确保 所 有 thread 都 以 一 个 合理 的 速度 前 进 。 但 是 ， 出 于 历史 原因 和 语言 技术 
原因 ，C++ 标准 只 是 鼓励 而 非 要 求 可 抢占 性 〈 见 iso.1.10 )。 

通常 ， 程 序 员 不 应 乱用 系统 时 钟 。 但 如 果 时 钟 被 重 置 (比如 说 ， 由 于 它 偏离 了 真实 时 
间 )，wait_until() 就 会 受到 影响 ， 而 wait_for() 则 不 会 。timed_mutex 的 wait_until() 和 
wait_for() 也 是 如 此 ( 见 41.3.1.3 节 )。® 


42.2.7 杀 死 thread 


我 发 现 thread 漏 掉 了 一 个 重要 操作 ， 没 有 一 种 简单 的 标准 方法 告知 一 个 正在 运行 的 
thread 我 对 其 任务 已 经 失去 了 兴趣 ， 因 此 请 它 停 止 运行 并 释放 所 有 资源 。 例 如 ， 如 果 我 启 
动 一 个 并 行 find() ( 见 42.4.7 节 )， 可 能 常常 需要 在 找到 答案 后 要 求 剩余 任务 停止 运行 。 此 操 
作 (在 不 同 语言 和 系统 中 被 称 为 杀 死 、 取 消 和 终止 ) 的 缺席 有 各 种 历史 原因 和 技术 原因 。 

如 需要 ， 应 用 程序 员 可 以 编写 自己 的 杀 线程 操作 。 例 如 ， 很 多 任务 包含 一 个 请 求 循 环 。 
在 此 情况 下 ， 发 送 一 条 “请 自杀 ”消息 给 一 个 thread 即 可 令 其 释放 所 有 资源 并 结束 。 如 果 没 
有 请 求 循环 ， 线 程 可 以 周期 性 地 检查 一 个 “需要 ”变量 来 判断 用 户 是 否 还 需要 本 线程 的 结果 。 

因此 ， 设 计 并 实现 一 个 适用 所 有 系统 的 通用 取消 操作 可 能 很 困难 ， 但 在 我 所 见 的 应 用 
中 ， 实 现 一 个 专用 的 取消 机 制 还 是 相对 简单 的 。 


42.2.8 thread _ local 数据 


如 其 名 ,一 个 thread _ local 变量 是 一 个 thread 专 有 的 对 象 ， 其 他 thread 不 能 访问 ， 除 
非 其 拥有 者 (不 小 心 ) 将 指向 它 的 指针 提供 给 了 其 他 线程 。 因 此 ，thread_local 类 似 局 部 变 
量 , 但 局 部 变量 有 自己 的 生命 期 , 访问 局 限于 其 作用 域内 (在 某 个 函数 中 )， 而 thread_local 
则 被 一 个 thread 的 所 有 函数 所 共享 ， 且 只 要 thread “活跃 ” 它 就 “活跃 ”。thread_local 对 
象 可 以 是 extern 的 。 

在 大 多 数 情况 下 ， 将 对 象 定义 为 局 部 变量 (在 栈 中 ) 比 共享 它们 要 好 ; 因而 thread_ 
local 存在 与 全 局 变量 相同 的 问题 。 照 例 ， 我 们 可 以 用 名 字 空 间 限 制 非 局 部 数据 的 问题 。 但 
是 ， 在 很 多 系统 中 ， 一 个 thread 能 使 用 的 栈 空间 是 很 有 限 的 ， 因 此 对 于 要 求 大 量 非 共享 数 


加 “这 里 的 第 一 个 wait_until() 和 wait_for() 似 应 为 sleep_until() 和 sleep_for() ; 第 二 个 wait_until() 和 wait_ 
for() 似 应 为 try_lock_until() 和 try_lock_for()。 一 一 译 者 注 
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据 的 任务 来 说 thread_local 存储 就 很 变 得 重要 了 。 

我 们 说 一 个 thread_local 具有 线程 存储 存续 时 间 (thread storage duration， 见 iso.3.7.2 )。 
每 个 thread 对 thread_local 变量 都 有 自己 的 拷贝 。thread_local 在 首次 使 用 前 初始 化 〈 见 
iso.3.2 ) 。 如 果 已 构造 ， 会 在 thread 退出 时 销毁 。 

thread local 存储 的 一 个 重要 用 途 是 供 thread 显 式 缓存 互 斥 访问 数据 。 这 会 增 大 程序 
逻辑 的 复杂 度 ， 但 在 具有 共享 缓存 的 机 器 上 ， 有 时 能 带 来 显著 的 性 能 提升 。 而 且 ， 这 种 机 制 
通过 数据 的 大 批量 传输 能 简化 或 降低 锁 的 代价 。 

一 般 而 言 ， 非 局 部 内 存 是 并 发 编程 的 一 个 难题 ， 因 为 确定 数据 是 否 共享 通常 不 那么 简 
单 ， 因 而 可 能 成 为 数据 竞争 之 源 。 特 别 是 ，static 类 成 员 可 能 成 为 一 个 大 问题 ， 因 为 它们 通 
常 对 类 用 户 是 隐藏 的 ， 因 此 潜在 的 数据 竞争 很 容易 被 忽略 。 考 虑 设计 一 个 Map， 对 每 个 类 
型 都 有 默认 值 : 


template<typename K, typename V> 
class Map{ 


static void set_default(const K&,V&); // 对 所 有 Map<K,V> 类 型 的 映射 设置 默认 值 
private: 
static pair<const K,V> default_value; 
}; 
为 什么 用 户 会 怀疑 两 个 不 同 Map 对 象 间 存 在 数据 竞争 呢 ? 显 然 ， 用户 可 能 在 众多 成 员 中 
发 现 set_default() 有些 可 疑 ， 但 set_default() 毕竟 是 一 个 很 容易 被 忽略 的 次 要 特性 〈 见 
16.2.12 节 )。 
static 值 (每 类 一 个 ) 曾 被 广泛 使 用 。 包 括 默认 值 、 使 用 计数 、 缓 存 、 空 闲 链表 、 常 见 
问题 解答 以 及 很 多 不 著名 的 应 用 。 当 用 于 并 发 系统 时 ， 会 有 一 个 经 典 问题 : 
儿 线程 1 中 某 处 : 


Map<string,int>::set_default("Heraclides",1); 





川 线程 2 中 某 处 : 
Map<string,int>::set_default("Zeno",1); 
这 段 代 码 存在 潜在 数据 竞争 : 哪个 thread 先 执行 set_default() 呢 ? 
利用 thread_local 可 帮助 解决 此 问题 : 


template<typename K, typename V> 
class Map { 
ll... 
private: 
static thread_local pair<const K,V> default_value; 
}; 
现在 不 再 有 潜在 数据 竞争 了 ,但 同时 也 不 再 有 所 有 用 户 共 享 的 单一 default_value 了 。 在 本 
例 中 ,线程 1 永远 看 不 到 线程 2 中 执行 set_default() 的 效果 。 使 用 thread_local 往往 会 改 
变 原始 代码 的 意图 ， 因 此 我 们 只 不 过 是 将 一 个 错误 变 为 另 一 个 错误 而 已 。 要 保持 对 static 数 
据 成 员 的 怀疑 (因为 你 永远 也 不 知道 你 的 代码 是 否 某 天 可 能 作为 一 个 并 发 系统 的 一 部 分 执 
行 )， 但 不 要 将 thread_local 视 为 灵丹妙药 。 
名 字 空 间 变 量 、 局 部 static 和 类 static 成 员 都 可 以 声明 为 thread_local。 类 似 局 部 
static 变量 ，thread_local 局 部 变量 的 构造 受 首 次 切换 的 保护 ( 见 42.3.3 节 )。 多 个 thread_ 


302 ” 镶 四 部 分 村 准 座 


local 的 构造 顺序 是 未 定义 的 ， 因 此 应 保证 不 同 thread_ local 的 构造 与 它们 的 顺序 无 关 ， 而 
且 尽 可 能 使 用 编译 时 或 链接 时 初始 化 。 类 似 static 变量 ，thread_local 默认 初始 化 为 零 ( 见 
6.3.5.1 节 )s 


42.3 ”避免 数据 竞争 

避免 数据 竞争 的 最 好 方法 是 不 共享 数据 。 将 感 兴趣 的 数据 保存 在 局 部 变量 中 ， 保 存在 不 
与 其 他 线程 共享 的 自由 存储 中 ， 或 是 保持 在 thread_local 内 存 中 ( 见 42.2.8 节 )。 不 要 将 这 
类 数据 的 指针 传递 给 其 他 thread。 当 另 一 个 thread 需要 处 理 这 类 数据 时 (如 并 行 排序 )， 传 
递 数 据 特 定 片 段 的 指针 并 确保 在 任务 结束 之 前 不 触 碰 此 数据 片段 。 

这 些 简 单 规则 背后 的 思想 是 避免 并 发 数据 访问 ， 因 此 程序 不 需要 锁 机 制 且 能 达到 最 高 
效率 。 在 不 能 应 用 这 些 规则 的 场合 ， 例 如 有 大 量 数据 需要 共享 的 场合 ， 可 使 用 某 种 形式 的 锁 
机 制 : 

@ 互 斥 量 (mutex): 互 斥 量 ( 互 斥 变量 ，mutual exclusion variable) 就 是 一 个 用 来 表示 

某 个 资源 互 斥 访问 权限 的 对 象 。 为 访问 资源 ， 先 获取 互 斥 量 ， 然 后 访问 数据 ， 最 后 
释放 互 斥 量 ( 见 5.3.4 节 和 42.3.1 节 )。 

@ 条 件 变量 (condition variable): 一 个 thread 用 条 件 变量 等 待 另 一 个 thread 或 计时 器 生 

成 的 事件 ( 见 5.3.4.1 节 和 42.3.4 节 )。 

严格 来 说 ， 条 件 变量 不 能 防止 数据 竞争 ， 而 是 帮 有 我 们 避免 引入 可 能 引起 数据 竞争 的 共享 

数据 。 


42.3.1 互 斥 量 


mutex 对 象 用 来 表示 资源 的 互 斥 访 问 。 因 此 ， 它 可 用 来 防止 数据 竞争 以 及 同步 多 个 
thread 对 共享 数据 的 访问 。 


互 斥 量 类 (iso.30.4 ) 
mutex 一 个 非 递 归 互 斥 量 ， 如 果 尝 试 获取 一 个 已 被 获取 的 mutex，thread 会 阻塞 
recursive_mutex 可 被 单个 thread 重复 获取 的 互 斥 量 
timed_mutex 一 个 非 递 归 互 斥 量 ， 提 供 操作 (只 ) 在 指定 时 长 内 尝试 获取 互 斥 量 
recursive_timed_mutex 递归 限时 互 斥 量 
lock_guard<M> mutex M 的 守卫 
unique_lock<M> mutex M 的 锁 


“普通 ”mutex 是 最 简单 、 最 小 也 最 快 的 互 斥 量 。 递 归 和 限时 互 斥 量 增加 了 功能 ， 但 也 带 来 
了 少量 额外 开销 ， 这 一 开销 对 特定 机 器 上 的 特定 应 用 可 能 很 严重 , 但 也 可 能 并 不 重要 : 
在 任何 时 刻 ， 一 个 互 斥 量 只 能 被 一 个 thread 所 拥有 : 
e 获取 (acquire) 一 个 互 斥 量 意味 着 获得 它 的 排他 所 有 权 ; 获取 操作 可 能 阻塞 执行 它 的 
thread。 
@ 释放 (release) 一 个 互 斥 量 意味 着 放弃 排他 所 有 权 ; 释放 操作 允许 男 一 个 thread 能 最 
终 获 取 互 斥 量 。 即 ， 释 放 操 作 能 令 正在 等 待 的 thread 退出 阻塞 状态 。 
如 果 多 个 thread 阻塞 在 同一 个 mutex 上 ， 系 统 调度 器 会 选择 其 中 一 个 解除 阻塞 状态 ， 而 选 
择 的 方式 有 可 能 造成 某 个 不 幸 的 thread 永远 也 不 会 解除 阻塞 进入 运行 状态 。 这 被 称 为 馈 死 


锅 42 复线 程 和 企 参 303 








(starvation)， 而 一 个 公平 〈fair) 调度 算法 可 以 通过 赋予 每 个 thread 同等 的 继续 前 进 的 机 会 
来 避免 饭 死 。 例 如 ， 一 个 调度 器 可 能 一 直选 择 thread::id 最 大 的 thread 作为 下 一 个 运行 的 
线程 ， ee id 较 小 的 thread。C++ 标准 并 不 保证 公平 性 ， 但 实际 的 调度 器 都 是 “公平 
合理 的 ” 。 即 ， 它 们 令 thread 永远 饿 死 的 可 能 性 极 低 。 例 如 ， 调 度 器 可 能 从 阻塞 thread 中 
| ni 
单独 一 个 互 斥 量 什么 也 做 不 了 ， 互 斥 量 是 用 来 表示 其 他 东西 的 ， 即 ， 用 其 所 有 权 表 示 
操纵 某 个 资源 的 权限 ， 例 如 一 个 对 象 、 某 个 数据 或 一 个 IO 设备 。 例 如 ， 我 们 可 以 定义 一 个 
cout_mutex 来 表示 从 一 个 thread 中 使 用 cout 的 权限 : 
mutex cout_mutex; // 表示 使 用 cout 的 权限 


template<typename Arg1, typename Arg2, typename Arg3> 
void write(Arg1 a1, Arg2 a2 = {}, Arg3 a3 = {}) 


{ 
thread::id name = this_thread::get_id(); 
cout_mutex.lock(); 
cout << "From thread " << name <<":"<<a1<< a2 << a3; 
cout_mutex.unlock(); 

} 


如 果 所 有 thread 都 使 用 write()， 我 们 应 该 将 来 自 不 同 thread 的 输出 正确 地 分 开 。 障 碍 在 于 
每 个 thread 都 必须 按 设想 使 用 互 斥 量 ， 而 一 个 互 斥 量 与 其 资源 之 间 的 对 应 关系 是 隐 含 的 。 在 
cout_mutex 例子 中 ， 如 果 一 个 thread 直接 使 用 cout ( 绕 过 cout_mutex) 就 会 把 输出 搞 乱 。 
C++ 标准 保证 cout 变量 不 会 被 破坏 ， 但 不 保证 来 自 不同 线 程 的 输出 内 容 不 会 混杂 在 一 起 ， 

注意 ， 我 只 在 一 条 语句 需要 锁 时 才 锁 住 互 斥 量 。 为 了 尽量 降低 数据 竞争 和 thread 被 阻 
塞 的 机 会 ,我们 尝试 仅 在 必要 处 加 锁 来 最 小 化 锁 被 线程 持 有 的 时 间 。 被 锁 保 护 的 代码 段 被 称 
为 临界 区 ( critical section)。 为 了 保持 代码 的 高 效 性 以 及 免 受 锁 相 关 问 题 的 困扰 ， 我 们 应 尽 
量 减 小 临界 区 。 

标准 库 互 斥 量 提供 排他 所 有 权 语 义 (exclusive ownership semantics)。 即 ， 单 一 thread 
(在 某 个 时 刻 ) 拥有 对 资源 的 排他 访问 权 。 还 存在 其 他 类 型 的 互 斥 量 。 例 如 ， 多 读者 单 写 者 
互 斥 量 就 很 流行 ， 但 标准 库 (尚未 ) "Wi 如 果 你 需要 不 同类 型 的 互 斥 量 ， 使 用 
特定 系统 提供 的 特性 或 者 自己 编写 一 
42.3.1.1 mutex 和 Boel bate 


类 mutex 提供 一 组 简单 的 操作 


mutex (iso.30.4.1.2.1 ) 


mutex m {}: 默认 构造 函数 : m 不 被 任何 thread 所 拥有 ; constexpr; 不 抛 出 异常 
m. mutex() 析 构 函数 : 若 m 还 被 线程 拥有 ， 行 为 是 未 定义 的 

m.lock() 获取 m; 线程 阻塞 直至 获取 所 有 权 

m.try_lock() 尝试 获取 m; 返回 是 否 获 取 成 功 的 结果 

m.unlock() 释放 m 

native_handle_type 由 具体 C++ 实现 定义 的 系统 互 斥 量 类 型 

nh=m.native_handle() nh 为 互 斥 量 m 的 系统 句柄 


mutex 不 能 拷贝 或 移动 。 可 以 将 mutex 看 作 一 种 资源 ， 而 不 是 资源 的 句柄 。 实 际 上 ，mutex 
通常 实现 为 系统 资源 的 句柄 ， 但 由 于 这 种 系统 资源 不 能 共享 、 泄 漏 或 移动 ， 因 此 将 它们 分 开 
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考虑 通常 只 是 徒 增 复 杂 性 。 
mutex 的 基本 使 用 非常 简单 。 例 如 : 
mutex cout_mutex; // 初始 化 为 “不 被 任何 线程 拥有 ” 


void hello() 

{ 
cout_mutex.lock!(); 
cout << "Hello, "; 
cout_mutex.uniock(); 


} 
void world() 
{ 
cout_mutex.lock(); 
cout << "World!"; 
cout_mutex.unlock(); 
} 
int main() 
thread t1 {hello}; 
thread t2 {world}; 
t1.join(); 
t2.join(); 
} 
这 段 代码 会 输出 
Hello, World! 
或 
World! Hello, 


我 们 不 会 破坏 cout 或 得 到 混杂 的 输出 。 

当 另 一 个 thread 正在 使 用 资源 ， 而 我 们 又 有 其 他 工作 需要 做 时 (不想 等 待 )， 操 作 try_ 
lock() 就 很 有 用 了 。 例 如 ， 考 虑 设计 一 个 任务 生成 器 ， 它 为 其 他 线程 生成 任务 请 求 ， 放 人 一 
个 任务 队列 : 


extern mutex wqm; 
extern list<Work> waq; 


void composer() 
list<Work> requests; 


while (true) { 
for (int i=0; i!=10; ++i) { 
Work w; 
放 .… 生成 工作 请 求 … 
requests.push_back(w); 


} 

if (wqm.try_lock()) { 
wq.splice(requests); /将 请 求 spliceO 到 list 中 ( 见 31.4.2 节 ) 
wqm.unlock!(); 
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当 某 个 服务 器 thread 正在 检查 wq 时 ，composer() 能 继续 生成 其 他 任务 而 不 是 等 待 。 
当 使 用 锁 时 ， 我 们 必须 小 心 死 锁 。 即 ， 我 们 不 能 等 待 一 个 永远 也 不 会 被 释放 的 锁 。 最 简 
单 的 死 锁 只 需 一 把 锁 和 一 个 thread 就 能 产生 。 考 虑 线程 安全 的 输出 操作 的 一 个 变 体 : 


template<typename Arg, typename... Args> 
void write(Arg a, Args tail...) 


{ 
Cout_mutex.lock!(); 
cout << a; 
write(tail...); 
cout_mutex.unlock(); 
} 


现在 ， 如 果 一 个 thread 调用 write("Hello,","World!")， 它 就 会 在 对 tail 进行 递归 调用 时 产生 
死 锁 。 

标准 库 经 常 使 用 直接 递归 调用 和 互相 递归 调用 来 提供 解决 方案 。recursive_mutex 与 普 
通 mutex 很 相似 ， 区 别 仅 在 于 它 允 许 单一 thread 反复 获取 。 例 如 : 

recursive_mutex cout_mutex; 川 改 为 recursive_ mutex 以 避免 死 锁 


template<typename Arg, typename... Args> 
void write(Arg a, Args tail...) 


{ 
cout_mutex.lock(); 
cout << ai 
write(tail...); 
cout_mutex.unlock(); 
} 


现在 递归 调用 write() 可 被 cout_mutex 正确 处 理 了 。 
42.3.1.2 ”mutex 错误 

互 斥 量 操作 可 能 失败 ， 此 时 会 抛 出 一 个 system_error。 某 些 可 能 的 错误 反映 了 底层 系 
统 的 状态 : 


互 斥 量 状 态 (iso.30.4.1.2 ) 


resource_deadlock_would_occur 将 发 生死 锁 
resource_unavailable_try_again 某 个 本 机 句柄 不 可 用 
operation_not_permitted thread 不 被 允许 执行 此 操作 
device_or_resource_busy 某 个 本 机 句柄 已 加 锁 
invalid_argument 一 个 构造 函数 的 本 机 句柄 实 参 是 错误 的 
例如 : 
mutex mtx; 
try{ 
mtx.lock(); 
mtx.lock(); 外 尝试 第 二 次 加 锁 
(system_error& e) { 


mtx.unlock(); 
cout << e.what() << \n ; 
cout << e.code() << \n'; 


device or resource busy 
generic: 16 


本 例 看 起 来 是 使 用 lock_guard 和 unique_lock ( 见 42.3.1.4 节 ) 的 有 力 依 据 。 
42.3.1.3 timed_mutex 和 recursive_ timed_mutex 

一 个 简单 的 mtx.lock() 是 无 条 件 的 。 如 果 我 们 不 希望 阻塞 ， 可 以 使 用 mtx.try_lock()， 
但 当 获 取 mtx 失 败 时 ， 我 们 常常 希望 等 待 一 会 儿 再 重 试 。timed_mutex 和 recursive_ 
timed_mutex 提供 了 这 种 功能 : 


timed_mutex (iso.30.4.1.3.1 ) 


timed_mutex m {}; 默认 构造 函数 ; m 不 被 任何 线程 拥有 ; constexpr; 不 抛 出 异常 
m.-timed_mutex() 析 构 函数 ; 若 m 还 被 线程 拥有 ， 行为 是 未 定义 的 

m.lock() 获取 m; 线程 阻塞 直至 获取 所 有 权 

m.try_lock() 尝试 获取 m; 返回 是 否 获取 成 功 的 结果 

m.try_lock_for(d) 尝试 获取 m， 最 多 等 待 duration d; 返回 是 否 获 取 成 功 的 结果 
m.try_lock_until(tp) 尝试 获取 m， 最 多 等 待 到 time_point tp; 返回 是 否 获 取 成 功 的 结果 
m.unlock() 释放 m 

native_handle type 由 具体 C++ 实现 定义 的 系统 互 斥 量 类 型 

nh=m.native_handle() nh 为 互 斥 量 的 系统 句柄 


recursive_ timed_mutex 接口 等 价 于 timed_mutex 接口 (就 像 recursive_mutex 接口 等 价 于 
mutex 接口 一 样 )。 

对 于 this_thread， 我 们 可 以 sleep_until(tp) 到 一 个 time_point 以 及 sleep_for(d) 一 个 
duration ( 见 42.2.6 节 )。 更 一 般 的 情况 是 ， 我 们 可 以 对 一 个 timed_mutex m 执行 m.try_ 
lock_until(tp) 或 m.try_lock_for(d)。 如 果 tp 早 于 当前 时 间 点 或 d 小 于 等 于 零 ， 则 操作 等 价 
于 一 个 “普通 ”try_lock()。 

例如 ， 考 虑 用 一 个 新 图 像 更 新 输出 缓冲 区 的 问题 (例如 ， 在 视频 游戏 或 可 视 化 应 用 中 ): 


extern timed_mutex imtx; 
extern image buf; 


void next() 


while (true) { 
Image next_image; 


fs 计算 


if (imtx.try_lock(milliseconds{100})) { 
buf = next_image; 
imtx.uniock(); 


} 
这 里 有 一 个 假设 : 如 果 图 像 更 新 速度 不 够 快 (本 例 中 是 100 毫秒 )， 用 户 宁 愿 放弃 它 而 继续 
更 新 其 下 一 个 版 本 。 还 有 一 个 假设 是 : 用 户 很 少 会 注意 到 在 一 个 图 像 更 新 序列 中 漏 掉 了 一 幅 
图 像 ， 因 此 不 需要 更 复杂 的 解决 方案 。 
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42.3.1.4 lock_guard 和 unique_lock 
锁 是 一 种 资源 ， 因 此 我 们 不 能 忘记 释放 它 。 即 ， 每 个 m.lock() 操作 必须 有 一 个 
m.unlock() 操作 与 之 匹配 。 关 于 锁 有 一 些 常 犯 的 错误 ， 例 如 : 


void use(mutex& mtx, Vector<string>& vs, int i) 


{ 
mtx.lock(); 
if (i<0) return; 
string s = vs[il; 
ties 
mtx.unlock(); 

¥ 


这 段 代 码 中 有 mtx.unlock()， 但 和 若 i<0 或 1 超出 了 vs 的 范围 ， 而 vs 具备 范围 检查 功能 ， 则 
线程 的 执行 永远 也 不 会 到 达 mtx.unlock()， 从 而 mtx 将 被 永远 锁 住 。 

标准 库 提供 了 两 个 RAII 类 lock_guard 和 unique_lock 来 解决 这 种 问题 。 

“普通 的 "lock_guard 是 最 简单 、 最 小 也 最 快 的 锁 保 护 机 制 。 unique_lock 具有 更 多 功能 ， 
但 也 带 来 了 一 些 额外 代价 ， 这 样 的 代价 在 特定 机 器 上 的 特定 应 用 中 有 可 能 很 严重 ， 但 也 可 能 
并 不 重要 。 


lock_guard<M> (iso.30.4.2 ) 


lock_guard Ick {m}; Ick 获取 m; 显 式 构造 函数 
lock_guard Ick {m,adopt lock it}; lck 保有 m; 假定 当前 thread 已 经 获取 了 m; 不 抛 出 异常 
Ick.“lock_guard() 析 构 函数 ; 对 保有 的 互 斥 量 调用 unlock() 
例如 
void use(mutex& mtx, vector<string>& vs, int i) 
{ 


lock_guard<mutex> g {mtx}; 
if (i<0) return; 
string s = vs[i]; 
Ws 
} e 
lock_guard 的 析 构 函数 会 对 其 实 参 调用 必要 的 unlock()。 
一 如 以 往 ， 我 们 持 有 锁 的 时 间 应 该 尽量 短 ， 如 果 我 们 只 在 一 小 段 作 用 域 中 需要 锁 ， 就 
不 应 一 直 持 有 锁 直 到 一 个 很 大 的 作用 域 结束 ，lock_guard 不 应 成 为 这 种 做 法 的 借口 。 显 然 ， 
检查 i 并 不 需要 锁 ， 因 此 我 们 应 该 在 此 之 后 获取 锁 : 


void use(mutex& mtx, vector<string>& vs, int i) 


{ 
if (i<0) return; 
lock_guard<mutex> g {mtx}; 
string s = vsli]; 
1 ;3 

} 


而 且 ， 想 象 我 们 只 在 读 取 vli] 时 需要 锁 。 这 样 ， 我 们 可 以 将 lock_guard 应 用 于 一 个 很 小 的 
作用 域 : 


void use(mutex& mtx, vector<string>& vs, int i) 


if (i<0) return; 


308 淄 四 部 分 村 准 庆 


string s; 

{ 
lock_guard<mutex> g {mtx}; 
s= vs[i]; 


} 
这 样 复杂 的 代码 有 必要 吗 ? 如 果 不 考 察 “隐藏 于 … 内 ”的 代码 ， 我 们 无 法 分 辨 ， 但 我 们 绝 
不 应 该 只 是 因为 不 愿 考虑 哪里 需要 锁 而 使 用 lock_guard。 一 般 而 言 最 小 化 临界 区 是 很 有 价 
值 的 事情 ， 这 至 少 能 迫使 我 们 严谨 思考 哪里 需要 锁 ， 为 什么 需要 。 

因此 ，lock_guard (以 及 unique_lock) 是 一 种 对 象 资源 句柄 (“守卫 ”)， 你 可 以 对 对 象 
加 锁 来 获取 所 有 权 ， 解 锁 来 释放 所 有 权 。 


lock_guard 


这 种 对 象 被 称 为 可 锁 对 象 (lockable object)。 标 准 库 互 斥 量 对 象 显然 是 可 锁 的 ， 但 用 户 也 可 
以 定义 自己 的 可 锁 对 象 类 型 。 

lock_guard 是 一 个 非常 简单 的 类 ， 不 包含 什么 有 趣 的 操作 。 它 所 做 的 所 有 事情 就 是 对 
mutex 实现 RAII。 为 了 获得 一 个 提供 内 含 mutex 上 的 RAII 和 操作 的 对 象 ， 应 使 用 unique __ 
lock: 





unique_lock<M> (iso.30.4.2 ) 
m 是 一 个 可 锁 对 象 





unique_lock Ick {}; 默认 构造 函数 ; Ick 不 保有 一 个 互 斥 量 ; 不 抛 出 异常 

unique_lock Ick {m}; Ick 获取 m; 不 抛 出 异常 

unique_lock Ick {m,defer_lock}; Ick 保有 m 但 不 获取 它 

unique_lock Ick {m,try_to_lock_t}; Ick 保 有 m 并 执行 m.try_lock(); 若 尝试 成 功 Ick 就 拥有 m; 否则 不 拥有 

unique_lock Ick {m,adopt_lock_t}; lck 保有 m; 假定 当前 thread 已 经 获取 了 m 

unique_lock Ick {m,tp}; lck 保有 m 并 调用 m.try_lock_until(tp) ; 若 尝试 成 功 Ick 就 拥有 m ; 否 
则 不 拥有 

unique_lock Ick {m,d}; Ick 保有 m 并 调用 m.try_lock_for(d) ; 若 尝 试 成 功 Ick 就 拥有 m ; 否则 
不 拥有 

unique_lock Ick {lck2}; 移动 构造 函数 : Ick 保有 Ick2 原 有 的 (如 果 有 的 话 ) 互 斥 量 ; Ick2 不 再 
保有 互 斥 量 

Ick.“unique_lock!() 析 构 函数 : 对 保有 的 (如 果 有 的 话 ) 互 斥 量 调用 unlock() 

Ick2=move(Ick) 移动 赋值 操作 : Ick 保有 Ick2 原 有 的 (如 果 有 的 话 ) 互 斥 量 ; Ick2 不 再 
保有 互 斥 量 

Ick.lock() m.lock() 

Ick.try_lock() m.try_lock(); 返回 是 否 获取 成 功 的 结果 

Ick.try_lock_for(d) m.try_lock_for(d); 返回 是 否 获取 成 功 的 结果 

Ick.try_lock_until(tp) m.try_lock_ until(tp); 返回 是 否 获 取 成 功 的 结果 

Ick.unlock() m.unlock() 


lck.swap(lck2) 交换 Ick 和 Ick2 的 可 锁 对 象 
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( 续 ) 
unique_lock<M> (iso.30.4.2 ) 
m 是 一 个 可 锁 对 象 

pm=lck.release() Ick 不 再 拥有 *pm; 不 抛 出 异常 
Ick.owns_lock() lock 拥有 一 个 可 锁 对 象 吗 ? 不 抛 出 异常 
bool b {Ick}; 转换 为 bool 类 型 ; b==lck.owns_lock(); 显 式 构造 函数 ; 不 抛 出 异常 
pm=lck.mutex() *pm 为 所 拥有 的 可 锁 对 象 (如 果 有 的 话 ) 否则 pm==nullptr; 不 抛 出 异常 
swap(lck,lck2) lck.swap(lck2); 不 抛 出 异常 


显然 ， 仅 当 保存 的 互 斥 量 是 一 个 timed_mutex 或 recursive_ timed_mutex 时 ， 才 允许 执行 
限时 操作 。 
例如 : 


mutex mtx; 
timed_mutex mtx2; 


void use() 


{ 
unique_iock<defer_ iock_t,mutex> ick {mtx}; 
unique_lock<defer_lock_ttimed_mutex> Ick2 {mtx2}; 


lck.try_lock_for(milliseconds{2}); 儿 错误 : 互 斥 量 没有 成 员 try_lock for0) 


ick2.try_lock_for(milliseconds{2})); 儿 正确 
ick2.try_lock_until(steady_clock::now()+milliseconds{2}); 
Hs 

} 


如 果 你 传递 给 unique_lock 的 构造 函数 一 个 duration 或 time_point 作为 第 二 个 参数 ， 构 造 函 
数 会 执行 恰当 的 尝试 加 锁 操 作 。owns_lock() 操作 允许 我 们 检查 获取 操作 是 否 成 功 。 例 如 : 


timed_mutex mtx2; 


void use2() 

{ 
unique_lock<timed_mutex> Ick2 {mtx2,milliseconds{2}}; 
if (Ick2.0owns_lock()) { 


/| 获取 成 功 : 
咱 ... 执行 一 些 操作 … 

} 

else{ 
儿 超 时 : 
// .做 一 些 其 他 操作 … 

} 

} 
42.3.2 ”多 重 锁 


为 执行 某 个 任务 获取 多 个 资源 的 需求 非常 常见 。 不 幸 的 是 ， 获 取 两 个 锁 就 可 能 产生 死 锁 。 例 如 : 


mutex mtx1; /保护 一 个 资源 
mutex mtx2; /保护 另 一 个 资源 


void task(mutex& m1, mutex& m2) 





{ 
unique_lock<mutex> Ick1 {m1}; 
unique_lock<mutex> Ick2 {m2}; 
儿 … 使 用 资源 … 

} 


thread t1 {task,ref(mtx1),ref(mtx2)}; 

thread t2 {task,ref(mtx2),ref(mtx1)}; 
是 引用 包装 器 std::ref()， 来 自 <functional> ( 见 33.5 节 )。 为 了 传递 引用 ， 我 们 需要 使 

可 变 参 数 模板 (thread 构造 函数 ; 见 42.2.2 节 )。 互 斥 量 不 能 拷贝 或 移动 ， 因 此 必须 通过 
uv 传递 互 斥 量 。 

将 mtx1 和 mtx2 改 为 不 暗示 顺序 的 名 字 ， 并 将 源码 中 t1 和 t 的 定义 分 离开 ， 则 程序 
最 终 发 生死 锁 一 一 t1 拥有 mtx1，t2 拥有 mtx2， 然 后 两 者 都 永远 处 于 尝试 获取 第 二 个 互 斥 量 
的 状态 一 一 的 可 能 性 就 不 再 那么 明显 了 。 





锁 (iso.30.4.2 ) 
locks 是 一 个 或 多 个 可 锁 对 象 构 成 的 序列 Ick1、lck2 、lck3、 


尝试 获取 locks 的 所 有 成 员 ; 这 些 锁 是 按 顺序 获取 的 ; 若 所 有 锁 都 成 功 获取 ，x=-1 ; 否 
则 x=n， 其 中 mn 为 不 能 获取 的 锁 的 数量 ， 且 不 会 保有 任何 锁 


lock(locks) 获取 locks 的 所 有 成 员 ; 不 会 产生 死 锁 








x=try_lock(locks) 


C++ 标准 并 未 指定 try_lock() 算法 如 何 设计 ,但 一 个 可 能 的 实现 如 下 所 示 : 


template <typename M1, typename... Mx> 
int try_lock(M1& mtx, Mx&. tail...) 


{ 
if (mtx.try_lock()) { 
intn = try_lock(tail...); 
if (n == -1) return -1; /获取 了 所 有 锁 
mtx.uniock(); // 回 退 
return n+1; 
} 
return 1; /1 不 能 获取 mtx 
} 


template <typename M1> 
int try_lock(M1& mtx) 


{ 
return (mtx.try_lock()) ? -1 : 0; 


} 
有 了 lock() 操作 ， 前 面 错 误 的 task() 就 可 以 修改 为 正确 且 更 简洁 的 版 本 : 


void task(mutex& m1, mutex& m2) 


{ 
Unique lock Ick1 {m1,defer_ lock_t}; 
unigque_lock Ick2 {m1,defer_lock_t}; 
lock(Ick1 ,lck2); 
儿 .… 使 用 资源 ... 

} 


， 直 接 将 lock() 用 于 多 个 互 斥 量 ， 如 lock(m1,m2)， 而 不 是 用 于 unique_lock， 就 会 将 
Sr m1 和 m2 的 责任 留 给 程序 员 。 
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42.3.3 call_once() 


我 们 通常 希望 初始 化 对 象 时 不 会 产生 数据 竞争 。 为 此 ， 类 型 once_flag 和 函数 call_once() 
提供 了 一 种 高 效 且 简 单 的 底层 工具 。 


call_once (iso.30.4.2 ) 
once_flag fl {}; 默认 构造 函数 : fi 未 使 用 
call_oncel(fl,f,args) 若 f 尚未 使 用 ;调用 fargs) 





例如 : 


class X{ 

public: 
X(); 
几 

private: 
i 
static once_flag static flag; 
static Y static_data_ for_class _X; 
static void init(); 


上 
X::X() 
call_oncel(static flag,init()); 

} 
可 以 将 call_once() 理解 为 这 样 一 种 方法 ， 它 简单 地 修改 并 发 前 代码 ， 这 些 代 码 依 赖 于 已 初 
始 化 的 static 数据 。 

我 们 可 以 用 call_once() 或 非常 像 call_once() 的 机 制 来 实现 局 部 static 变量 的 运行 时 初 
始 化 。 考 虑 下 面 的 代码 : 


Color& defauit_color() /用户 代 码 


static Color def { read_from_environment("background color ) }; 


return def; 

} 

可 能 实现 为 : 

Color& default color() // generated code 

{ 
static Color def; 
static flag __def; 
call_once(__def,read_ from_environment,"background color"); 
return def; 

} 


我 使 用 双 下 划 线 前 缀 ( 见 6.3.3 节 ) 强调 后 一 个 版 本 是 编译 器 生成 的 代码 。 





42.3.4 条 件 变量 


我 们 用 条 件 变 量 管理 thread 间 的 通信 。 一 个 thread 可 等 待 (阻塞 ) 在 一 个 condition_ 
variable 上 ， 直 至 发 生 某 个 事件 ， 如 到 达 一 个 特定 时 刻 或 者 另 一 个 thread 完成 。 
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condition_variable (iso.30.5 ) 
Ick 必须 是 一 个 unique_lock<mutex> 








condition_variable cv {}; 默认 构造 函数 ， 若 某 些 系统 资源 无 法 获得 ， 抛 出 system_error 
cv.“condition_variable() 析 构 函数 ; thread 不 会 等 待 ， 也 不 会 被 通知 
cv.notify_one() 解除 一 个 等 待 thread (如 果 有 的 话 ) 的 阻塞 状态 ; 不 抛 出 异常 
cv.notify_all() 解除 所 有 等 待 thread 的 阻塞 状态 ; 不 抛 出 异常 

Ick 必须 被 调用 thread 所 拥有 ; 调用 原子 操作 Ick.unlock() 并 阻塞 ; 当 收 到 
cv.Wait(lck) 


通知 时 解除 阻塞 ， 或 “ 伪 ” 唤 醒 ; 当 解 除 阻 塞 时 调用 Ick.lock() 
Ick 必须 被 调用 thread 所 拥有 ; 
while (!pred()) wait(lock) 
Ick 必须 被 调用 thread 所 拥有 ; 调用 原子 操作 Ick.unlock() 并 阻塞 ; 当 收 到 


cv.wait(Ick, pred) 


x=cv.wait_until(Ick,tp) 通知 或 时 间 已 达 tp 时 解除 阻塞 ; 当 解 除 阻塞 时 调用 Ick.lock() ; 若 超时 ，x 为 
timeout， 否 则 x=no_timeout 

b=cv.wait_until(Ick,tp,pred) while (!pred()) if (wait_until(Ick,tp)==cv_status::timeout); b=pred() 

x=cv.wait_for(Ick,d) x=cv.wait_until(Ick,steady_clock::now()+d) 

b=cv.wait_for(Ick,d,pred) b=cv.wait_until(Ick,steady_clock::now()+d,move(pred)) 

native_handle_type 参考 iso.30.2.3 

nh=cv.native_handle() nh 为 cv 的 系统 句柄 


condition_variable 可 能 (也 可 能 不 ) 依赖 系统 资源 ， 因 此 构造 函数 可 能 因 该 资源 缺乏 而 失 
败 。 但 是 ， 类 似 mutex，condition_variable 也 不 能 拷贝 或 移动 ， 因 此 最 好 将 condition_ 
variable 理解 为 资源 本 身 ， 而 非 资源 句柄 。 

当 销 毁 一 个 condition_variable 时 ， 必 须 通 知 ( 即 唤醒 ) 所 有 正在 等 待 的 thread， 和 否则 
它们 就 可 能 永远 处 于 等 待 状态 。 

wait_until() 和 wait_for() 返回 的 状态 定义 如 下 : 


enum class cv_status { no_timeout, timeout }; 


wait 函数 用 condition_variable 的 unique_lock 来 防止 等 待 thread 列表 上 的 数据 竞争 ， 以 
避免 唤醒 通知 被 漏 掉 。 

“普通 ”wait(lek) 是 一 种 低层 操作 ， 其 使 用 须 格外 小 心 ， 且 通常 用 于 某 些 高 层 抽象 的 实 
现 。 此 操作 可 能 导致 “ 伪 ” 唤 醒 。 即 ， 系 统 可 能 决定 恢复 wait() 的 thread， 即 使 没有 其 他 
thread 发 出 通知 ! 显然 ， 人 允许 伪 唤 醒 简 化 了 某 些 系统 中 condition_variable 的 实现 。 我 们 应 
保证 总 是 在 循环 中 使 用 “普通 ”wait()。 例 如 : 


while (queue.empty()) wait(queue_ick); 


使 用 此 循环 的 另 一 个 原因 是 某 些 thread 可 能 在 调用 无 条 件 wait() 的 thread 运行 之 前 就 已 
“悄悄 地 ”将 条 件 (本 例 中 的 queue.empty()) 变 为 无 效 了 。 这 种 循环 大 体 上 就 是 条 件 等 待 的 
实现 方式 ， 因 此 应 优先 选择 使 用 这 种 循环 而 非 无 条 件 wait()。 

thread 可 以 等 待 一 段 时 间 : 

void simple_timer(int delay) 

: condition_variable timer; 


mutex mtx; 咱 保 护 timer 的 互 斥 量 
auto t0 = steady_clock::now(); 
unique_lock<mutex> Ick(mtx); /| 获取 mtx 
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timer.wait_for(Ick,milliseconds{delay})); / 释放 和 获取 mtx 
auto t1 = steady_ciock::now(); 
cout << duration cast<milliseconds>(t1-t0).count() << “milliseconds passed\n"; 
}V/ 隐 式 释放 mtx 
这 段 代码 大 致 展示 了 this_thread::wait_for() 的 实现 。mutex 保护 wait_for() 不 发 生 数 据 竞 
争 。wait_for() 在 进入 睡眠 前 释放 其 mutex， 在 其 thread 解除 阻塞 状态 后 重新 获取 mutex。 
最 后 ，Ick 在 其 作用 域 结束 时 ( 隐 式 ) 释放 mutex。 
condition_variable 的 男 一 个 简单 应 用 是 控制 从 生产 者 到 消费 者 的 消息 流 : 
template<typename T> 
class Sync_queue { 
public: 
void put(const T& val); 


void put(T&& val); 
void get(T& val); 


private: 
mutex mtx; 
condition_variable cond; 
list<T> q; 

上 


其 设计 思想 是 put() 和 get() 不 会 彼此 妨碍 。 除 非 队 列 中 有 值 可 读 取 ， 否则 执行 get() 的 
thread 会 进入 睡眠 状态 。 


template<typename T> 
void Sync_queue::put(const T& val) 


{ 
lock_guard<mutex> ick(mtx); 
q.push_back(val); 
cond.notify_one(); 

} 


这 段 代码 的 工作 方式 是 ， 生 产 者 put() 获取 队列 mutex， 在 队列 尾 添 加 一 个 值 ， 调 用 notify_ 
one() 唤醒 可 能 处 于 阻塞 状态 的 消费 者 ， 并 隐 式 释放 mutex。 我 提供 了 一 个 右 值 版 本 的 put() 
以 便 传输 具有 移动 操作 但 无 拷贝 操作 的 类 型 的 对 象 ， 例 如 unique_ptr ( 见 5.2.1 节 和 34.3.1 
节 ) 和 packaged_task ( 见 42.4.3 节 ) 
在 这 段 代码 中 我 使 用 了 notify_one() 而 不 是 notify_all()， 因 为 我 只 是 添加 一 个 元 素 且 希 
望 保持 put() 简单 。 若 有 多 个 消费 者 ， 或 者 消费 者 落 在 生产 者 之 后 ， 则 需 重 新 考虑 如 何 选择 。 
get() 更 复杂 一 些 ， 因 为 它 应 该 仅 在 mutex 阻止 访问 或 队列 空 时 阻塞 其 thread: 


template<typename T> 
void Sync_queue::get(T& val) 


unique_lock<mutex> Ick(mtx); 
cond.wait(Ick,[this]{ return !q.empty(); }); 
val=q.front(); 
q.pop_front(); 

} 


get() 的 调用 者 会 保持 阻塞 状态 ， 直 至 Sync_queue 变 为 非 空 。 

我 使 用 了 unique_lock 而 不 是 普通 的 lock_guard， 因 为 lock_guard 已 优化 得 非常 简 
洁 ， 并 不 提供 解锁 和 重新 加 锁 mutex 所 需 的 操作 。 

我 通过 一 个 引用 参数 而 不 是 返回 值 从 get() 返回 结果 ， 以 确保 如 果 元 素 类 型 的 拷贝 构造 
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函数 能 抛 出 异常 的 话 ， 不 会 导致 麻烦 。 这 是 一 种 传统 技术 (例如 ，STL stack 适配器 提供 的 
pop() 以 及 容器 提供 的 front() 都 采用 了 这 种 技术 )。 我 们 可 以 编写 出 直接 返回 结果 的 get()， 
但 异常 复杂 ， 例 如 可 参考 future<T>::get() ( 见 42.4.4 节 )。 

一 个 简单 的 生产 者 - 消费 者 例子 可 以 非常 简单 : 

Sync_queue<Message> mq; 


void producer() 


while (true) { 


Message m; 
1 .六 写 mn. 
mq.put(m); 
} 
} 
void consumer() 
{ 
while (true) { 
Message mi; 
mq.get(m); 
儿 .… 使 用 下 … 
} 
} 


thread t1 {producer}; 
thread t2 {consumer}); 


通过 使 用 condition_variable， 消 费 者 不 必 再 操心 如 何 显 式 处 理 任 务 都 执行 完毕 的 情况 。 假 
如 我 们 只 是 简单 使 用 一 个 mutex 来 控制 对 Sync_queue 的 访问 ， 消 费 者 就 不 得 不 反复 唤醒 ， 
查看 队列 中 的 任务 ， 并 在 发 现 队列 空 后 决定 怎么 做 。 

我 用 一 个 list 保存 队列 元 素 ， 值 进出 list 都 采用 拷贝 方式 。 元 素 类 型 的 拷贝 操作 可 能 抛 
出 异常 ， 但 即使 它 抛 出 异常 ，Sync_queue 也 会 保持 不 变 ，put() 或 get() 操作 可 简单 地 宣告 
失败 。 

Sync_queue 本 身 不 是 一 个 共享 数据 结构 ， 因 此 我 们 并 不 为 它 使 用 一 个 单独 的 mutex ; 
只 有 put() 和 get() (分 别 更 新 队 首 和 队 尾 ， 两 者 可 能 是 相同 的 元 素 ) 才 需 要 防止 数据 竞争 。 

对 某 些 应 用 ， 简 单 的 Sync_queue 有 一 个 致命 缺陷 : 如 果 生 产 者 停止 添加 元 素 ， 导 致 
消费 者 永远 等 待 该 怎么 办 ? 如 果 消 费 者 有 其 他 事情 需要 做 ， 因 而 不 能 等 待 很 长 时 间 ， 该 怎么 
办 ? 对 此 有 很 多 解决 方法 ,一 种 常用 技术 是 为 get() 增加 超时 机 制 ， 即 ， 指 定 最 长 等 待 时 间 : 


void consumer() 


{ 
while (true) { 
Message mi; 
mq.get(m,milliseconds{200}); 
咱 ... 使 用 mm.. 
} 
} 


为 使 这 段 代 码 正 确 工 作 ， 我们 需要 为 Sync_queue 添加 第 二 个 get(): 
template<typename T> 
void Sync_ queue::get(T& val, steady_clock::duration d) 


{ 


unique_lock<mutex> fck(mtx); 
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bool not empty = cond.wait_for(Ick,d,[this]{ return !q.empty(); }); 
if (not_empty) { 

val=qg.front(); 

q:pop_front(); 
} 


else 
throw system_error{"Sync_queue: get() timeout"); 


} 
当 使 用 超时 机 制 时 ， 我 们 需要 考虑 等 待 之 后 做 什么 : 是 得 到 了 数据 还 是 仅仅 超时 了 ? 实际 
上 ， 我 们 并 不 关心 超时 ， 而 只 是 关心 谓词 (表达 为 lambda) 是 真 还 是 假 ， 从 而 wait_for() 返 
回 什 么 。 我 选择 通过 抛 出 异常 来 报告 get() 的 超时 错误 。 假 如 我 将 超时 看 作 一 种 常见 的 “ 非 
异常 ”事件 ， 就 会 选择 返回 一 个 bool 值 了 。 

我 们 可 以 对 put() 做 大 致 相同 的 修改 ， 当 任务 队列 满 时 它 会 等 待 消费 者 取 走 任务 ， 但 不 
会 等 竺 很 长 时 间 

template<typename T> 


void Sync_queue::put(T val steady_clock::duration d, int n) 
{ 
unique_lock<mutex> Ick(mtx); 
bool not_full = cond.wait_for(Ick,d,[this]{ return q.size()<n; }); 
if (not_full) { 
q.push_back(val); 
cond.notify_one!(); 
} 
else{ 
cond.notify_all(); 
throw system_error{"Sync_queue: put() timeout }; 
} 
} 


对 put() 而 言 ， 返 回 一 个 bool 值 的 替代 方案 鼓励 生产 者 总 是 显 式 处 理 两 种 情况 ， 看 起 来 比 当 
前 版 本 的 get() 更 有 吸引 力 。 但 为 了 避免 陷入 “处 理 溢出 的 最 佳 方案 ”的 讨论 ， 我 再 次 选择 
抛 出 异常 来 报告 失败 。 

当 队 列 满 时 ， 我 选择 了 notify_all()。 选 用 notify_all() 还 是 notify_one() 依赖 于 应 用 程 
序 的 行为 ， 并 不 总 是 那么 显而易见 。 只 通知 一 个 thread 会 将 队列 的 访问 串 行 化 ， 从 而 可 能 
在 有 多 个 潜在 消费 者 时 令 吞 吐 率 降低 。 另 一 方面 ， 通 知 所 有 等 待 thread 可 能 同时 唤醒 多 个 
thread， 产 生 对 互 斥 量 的 竞争 ， 并 可 能 导致 thread 被 反复 唤醒 而 只 是 发 现 队列 为 空 (被 其 他 
thread 删 空 ) 。 再 次 回 到 经 典 原 则 : 不 要 相信 你 的 直觉 ; 要 进行 测试 。 
42.3.4.1 condition_variable_any 

condition_variable 是 针对 unique_lock<mutex> 优化 的 。condition_variable_any 在 


功能 上 与 condition_variable 等 价 ， 但 可 操作 任何 可 锁 对 象 


condition_variable_any (iso.30.5.2 ) 
lck 可 以 是 具备 所 需 操 作 的 任何 可 锁 对 象 


… 类 似 condition_variable… 


42.4 基于 任务 的 并 发 
到 目前 为 止 ， 本 章 一 直 关 注 运行 并 发 任务 的 机 制 : 关注 点 是 thread、 避 免 数 据 竞争 和 
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thread 同步 。 对 很 多 并 发 应 用 ， 我 发 现 这 种 对 机 制 的 关注 会 分 散 我 们 对 实际 任务 ( 原 目标 ， 
指明 了 并 发 任务 ! ) 的 注意 力 。 本 节 介 绍 如 何 指定 一 种 简单 的 任务 : 一 种 根据 给 定 参 数 完 成 
一 项 工作 、 生 成 一 个 结果 的 任务 。 

为 了 支持 这 种 基于 任务 的 并 发 模型 ， 标 准 库 提 供 了 如 下 特性 : 


任务 支持 (iso.30.6.1 ) 








packaged task<F> 打包 一 个 类 型 为 F 的 可 调用 对 象 ， 作 为 任务 运行 
promise<T> 一 个 对 象 ， 描 述 了 接收 类 型 为 T 的 结果 的 目的 
future<T> 一 个 对 象 ， 描 述 了 类 型 为 T 的 结果 的 源 
shared_future<T> 一 个 future， 可 从 中 多 次 读 取 类 型 为 T 的 结果 
x=async(policy,f,args) 根据 policy 调用 f(args) 

根据 默认 策略 调用 : 


*=async(hargs) x=async(launch::asyncllaunch::deferred,f,args) 
这 些 特性 的 描述 暴露 了 很 多 细节 ， 而 这 些 细 节 没 有 必要 烦 扰 应 用 程序 编写 者 。 请 牢记 任务 模 
型 的 根本 原则 : 简单 性 。 大 多 数 更 复杂 的 细节 支持 的 都 是 很 少见 的 用 途 ， 例 如 隐藏 更 为 麻烦 
的 线程 和 锁 机 制 。 

标准 库 对 任务 的 支持 仅仅 是 如 何 支 持 基 于 任务 的 并 发 的 一 个 例子 而 已 。 我 们 常常 希望 提 
供 大 量 小 任务 ， 让 “系统 ”操心 如 何 将 它们 映射 到 硬件 资源 去 执行 以 及 如 何 避 免 它们 发 生 数 
据 竞 争 、 伪 唤醒 、 过 度 等 待 ， 等 等 。 

这 些 特 性 的 重要 性 在 于 它们 对 程序 员 而 言 非 常 简单 。 在 一 个 串 行程 序 中 ， 我 们 通常 会 编 
写 下 面 这 样 的 代码 : 

res =task(args); /| 给 定 参数 ,执行 一 个 任务 ， 得 到 结果 
并 行 版 本 变 为 : 

auto handie = async(task,args); 。 /|/ 给 定 参数 ， 执 行 一 个 任务 


儿 .… 进行 其 他 操作 … 
res = handle.get() // 得 到 结果 


有 时 ,我们 在 考虑 蔡 代 方案 、 细 节 、 性 能 和 权衡 时 会 忽视 简单 性 的 价值 。 我 们 应 优先 考虑 使 
用 最 简单 的 技术 ， 将 更 复杂 的 解决 方案 留 到 我 们 确信 和 真正 值得 使 用 的 地 方 。 
42.4.1 future 和 promise 
如 5.3.5 节 所 述 ， 任 务 间 的 通信 由 一 对 future 和 promise 处 理 。 任 务 将 其 结果 放 和 人 一 个 
promise， 需 要 此 结果 的 任务 则 从 对 应 的 future 提取 结果 : 
任务 1: 任务 2: 


ee set_value() 
get) —»[ future 
set_exception() 
值 


上 图 中 的 “ 值 ” 有 一 个 技术 术语 一 一 共享 状态 (shared state， 见 iso.30.6.4 )。 除 了 返回 值 或 
异常 ， 它 还 包含 两 个 thread 安全 交换 数据 所 需 的 信息 。 一 个 共享 状态 最 低 限度 应 能 保存 : 
@ 一 个 恰当 类 型 的 值 或 一 个 异常 。 对 于 一 个 “返回 void” 的 future， 此 值 什么 也 不 包含 。 
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e 一 个 就 绪 位 (ready bit)， 指 出 是 否 已 准备 好 一 个 值 或 一 个 异常 供 future 提取 。 
e 一 个 任务 ， 对 一 个 由 async() 用 策略 deferred ( 见 42.4.6 节 ) 调用 的 thread， 当 对 其 


future 调用 get() 时 ， 会 执行 此 任务 。 

一 个 使 用 计数 ( use count)， 使 得 当 且 仅 当 共享 状态 的 最 后 一 个 使 用 者 放弃 访问 时 才 
销毁 它 。 特 别 是 ， 如 果 共 享 状态 中 保存 的 值 的 类 型 具有 析 构 函数 ， 则 当 使 用 计数 变 
为 0 时 会 调用 此 析 构 函数 。 

一 些 互 斥 数据 ( mutual exclusion data)， 能 用 来 将 任何 可 能 处 于 等 待 的 thread 解除 阻 
塞 状态 (例如 condition_variable)。 


一 个 C++ 实现 可 为 共享 状态 提供 下 列 操作 : 


构造 : 可 能 使 用 用 户 提 供 的 分 配器 。 

就 绪 : 设置 “就 绪 位 ”并 将 任何 正在 等 待 的 thread 解除 阻塞 。 

释放 : 递减 使 用 计数 ， 若 这 是 最 后 一 个 使 用 者 ， 销 毁 共 享 状态 。 

丢弃 : 若 已 不 可 能 由 promise 将 一 个 值 或 异常 放 人 共享 状态 (例如 ， 由 于 promise 
已 被 销毁 )， 则 一 个 异常 future_error 和 错误 状态 broken_promise 被 存 人 共享 状态 
中 ， 共 享 状态 被 置 为 就 绪 。 


42.4.2 promise 


个 promise 就 是 一 个 共享 状态 ( 见 42.4.1 节 ) 的 句柄 。 它 是 一 个 任务 可 用 来 存放 其 结 


果 的 地 方 ， 供 其 他 任务 通过 future ( 见 42.4.4 节 ) 提取 。 


promise<T> (iso.30.6.5 ) 





promise pr {}; 点 认 构 造 函 数 : pr 有 一 个 尚未 就 绪 的 共享 状态 

promise pr {allocator_arg_t,a}; 构造 pr; 使 用 分 配器 a 构造 一 个 尚未 就 绪 的 共享 状态 

promise pr {pr2}; 移动 构造 函数 : pr 获得 pr2 的 状态 ; pr2 不 再 含有 共享 状态 ; 不 抛 出 异常 
pr.“promise() 析 构 函数 : 丢弃 共享 状态 ; 将 结果 和 置 为 broken_promise 异常 
pr2=move(pr) 移动 赋值 : pr2 获得 pr 的 状态 ; pr 不 再 含有 共享 状态 ; 不 抛 出 异常 
pr.swap(pr2) 交换 pr 和 pr2 的 值 ; 不 抛 出 异常 

fu=pr.get_future() fu 是 pr 对 应 的 future 

pr.set_value(x) 任务 的 结果 是 值 x 

pr.set_value() 为 void future 设置 任务 结果 

pr.set_exception(p) 任务 的 结果 是 p 指向 的 异常 ; p 是 一 个 exception_ptr 


pr.set_value_at_thread_exit(x) 任务 的 结果 是 值 x; 待 thread 退出 后 再 将 结果 置 为 就 绪 
pr.set_exception_at_thread ”任务 的 结果 是 p 指向 的 异常 ; p 是 一 个 exception_ptr ; 待 thread 退出 后 


exit(p) 再 将 结果 置 位 
swap(pr,pr2) pr.swap(pr2); 不 抛 出 异常 
promise 没有 拷贝 操作 。 


如 果 已 经 设置 了 一 个 值 或 异常 ， 则 函数 set 抛 出 future_error。 
通过 promise 只 能 传输 单一 结果 值 。 这 看 起 来 可 能 有 些 局 限 性 ， 但 记 住 值 是 被 移 人 、 
移出 共享 状态 的 ， 而 不 是 进行 拷贝 ， 因 此 我 们 可 以 以 很 低 的 代价 传输 一 组 对 象 。 例 如 : 


promise<map<string,int>> pr; 
map<string,int>> mi 


I 


.… 向 m 中 填 入 一 百 万 个 <string,int> 对 … 
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pr.set_value(m); 


任务 随后 即 可 从 对 应 future 提取 map， 而 代价 基本 为 0。 
42.4.3 packaged task 


packaged_task 保存 了 一 个 任务 和 一 个 future/ promise 对 。 


packaged_task: 





get() future 


set_value(x) 
set_exception(px) 


将 待 执 行 的 任务 (一 个 函数 或 一 个 函数 对 象 ) 传递 给 packaged_task。 当 任务 执行 到 return 
Xx 时， 会 引发 在 packaged_task 的 promise 上 调用 set_value(x)。 类 似 地 ，throw x 会 引 
发 一 个 set_exception(px)， 其 中 px 是 一 个 指向 x 的 exception_ptr。 基 本 上 ,packaged_ 
task 像 下 面 这 样 执行 其 任务 f(args): 


try { 
pr.set_value(f(args)); /假定 promise 名 为 pr 


任务 2: | 








} 
catch(...) { 
pr.set_exception(current_exception()); 


} 
packaged_task 提供 了 一 组 常规 操作 : 


packaged_task<R(ArgTypes...)> (iso.30.6.9 ) 
默认 构造 函数 : pt 未 保存 任务 ; 不 抛 出 异常 
packaged_task pt {f}; 构造 保存 f 的 pt; f 被 移入 pt; 使 用 默认 分 配器 ; 显 式 构造 函数 
packaged_task pt {allocator_arg_t,a,f}; 构造 保存 f 的 pt; f 被 移入 pt; 使 用 分 配器 a; 显 式 构造 函数 
移动 构造 函数 : pt 获得 pt2 的 状态 ; 移动 之 后 pt2 不 再 包含 任务 ; 


packaged _ task pt 分; 


packaged_task pt {pt2}; 


pt=move(pt2) 


pt."packaged_task(); 
pt.swap(pt2) 


pt.valid() 


fu=pt.get_future() 


pt()(args) 


pt.make_ready_at_exit(args) 


不 抛 出 异常 

移动 赋值 : pt 获得 pt2 的 状态 ; 递减 pt 之 前 共享 状态 的 使 用 计数 ; 
移动 之 后 pt2 不 再 包含 任务 ; 不 抛 出 异常 

析 构 函数 : 丢弃 共享 状态 

交换 pt 和 pt2 的 值 ; 不 抛 出 异常 

pt 包含 一 个 共享 状态 吗 ? 如 果 它 已 被 赋予 过 一 个 任务 且 未 被 移出 
过 ， 则 包含 共享 状态 ;不 抛 出 异常 

fu 是 pt 的 promise 对 应 的 future; 若 调用 两 次 ， 抛 出 future-error 

执行 flargs) ; f() 中 的 一 次 return x 会 对 pt 的 promise 执行 一 次 
set_value(x), f() 中 的 一 次 throw x 会 对 pt 的 promise 执行 一 次 
set_exception(x); px 是 一 个 指向 x 的 exception_ptr 

调用 f(args); 待 thread 退出 后 再 将 结果 置 位 为 就 绪 


重 置 为 初始 状态 ; 丢弃 旧 状 态 


pt.reset() 
swap(pt,pt2) 
uses_allocator<PT,A> 


pt.swap(pt2) 
车 PT 使 用 的 分 配器 类 型 为 A， 则 结果 为 true_type 
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packaged task 可 以 移动 但 不 能 拷贝 ,但 packaged _ task 可 以 拷贝 其 任务 ， 并 假定 任务 的 
副本 生成 与 原 任务 相同 的 结果 。 这 很 重要 ， 因 为 任务 可 能 与 其 packaged_task 一 起 移动 到 
一 个 新 thread 的 栈 中 。 

丢弃 一 个 共享 状态 (如 析 构 函数 和 移动 操作 所 做 的 ) 意味 着 令 其 就 绪 。 如 果 尚 未 保存 值 
或 异常 ， 就 会 保存 一 个 指向 future_error 的 指针 ( 见 42.4.1 节 )。 

make_ready_at_exit() 的 优点 是 直至 thread_local 变量 的 析 构 函数 执行 完毕 ， 任 务 的 
结果 才 可 用 。 

没有 对 应 get_future() 的 get_promise() 操作 。promise 的 使 用 完全 由 packaged_task 
处 理 。 

下 面 是 一 个 非常 简单 的 例子 ， 我 们 甚至 无 须 任 何 thread。 首 先 定义 一 个 简单 的 任务 : 


int ff(int i) 
{ 
if (i) return i; 
throw runtime_error("ff(0)"); 
} 
现在 我 们 可 以 将 此 函数 包装 进 packaged_task 并 调用 它们 了 : 
packaged task<int(int)> pt1 {ff}; 儿 将 人 在 保存 在 ptl 中 
packaged_task<int(int)> pt2 {ff}; 咱 将 位 保存 在 pt2 
pt1(1); 咱 令 ptl 调用 ff(1); 
pt2(0); 儿 令 pt2 调用 ff0); 


到 目前 为 止 ， 还 没 发 生 什么 事情 。 特 别 是 ， 我 们 没 看 到 ff(0) 触发 异常 。 实 际 上 ，pt1(1) 对 
pt1 关联 的 promise 执行 一 个 set_value(1)，pt1(0) 对 pt2 关联 的 promise 执行 一 个 set_ 
exception(px); px 是 一 个 指向 runtime_error("ff(0)") 的 exception_ptr。 

稍 后 ,我 们 可 以 尝试 提取 结果 。get_ future () 操作 用 来 获取 future， 其 中 保存 着 包装 线 
程 执 行 任务 的 结果 : 


auto v1 = pt1.get_future(); 
auto v2 = pt2.get_future(); 


try { 
cout << vi.get() << \n';i /| 打印 
cout << v2.get() << \n'; / 儿 抛 出 异常 
} 
catch (exception& e) { 
cout << "exception: " << e.what() << \n’; 


} 


程序 输出 结果 为 : 


1 
exception: ff(0) 


我 们 也 可 用 更 简单 的 版 本 获得 完全 一 样 的 效果 : 
try { 
cout << ff(1) << \n'; /将 打印 
cout << ff(0) << \n'; // 将 抛 出 


catch (exception& e){ 
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cout << "exception: " << e.what() << "\n'; 


} 


关键 点 在 于 packaged_task 版 本 与 普通 函数 调用 版 本 的 工作 方式 是 完全 一 样 的 ， 即 便 任务 
函数 (本 例 中 的 f) 和 get() 的 调用 是 在 不 同 的 thread 中 。 因 此 我 们 可 以 集中 精力 于 指明 任 
务 ， 而 不 是 思考 thread 和 锁 。 

我 们 可 以 移动 future、packaged_task 或 两 者 都 移动 。 最 终 ，packaged_ task 被 调 
用 ， 其 任务 会 将 结果 保存 在 future 中 ， 既 不 必 了 解 是 哪个 thread 执行 它 ， 也 不 必 了 解 哪个 
thread 将 接收 结果 。 这 是 一 种 简单 且 通 用 的 机 制 。 

考虑 处 理 一 系列 请 求 的 thread。 它 可 能 是 一 个 GUI thread、 一 个 拥有 特殊 硬件 访问 权 
限 的 thread 或 任意 用 队列 序列 化 资源 访问 的 服务 器 。 我 们 可 以 将 这 种 服务 实现 为 一 个 消息 
队列 ( 见 42.3.4 节 )， 或 传递 待 执行 的 任务 : 


using Res = 上 太 服 务 器 的 结果 类 型 */; 
using Args = 上 广 服 务 器 的 结果 类 型 ; 
using PTT = Res(Args); 


Sync_queue<packaged_task<PTT>> server; 


Res f(Args); /| 函数: 执行 一 些 操作 
struct G{ 
Res operator()(Args); 咱 函数 对 象 : 执行 一 些 操作 
ls 


上 
auto h = [=](Args a){/* 执行 一 些 操 作 */》; ll lambda 


packaged_task<PTT> job1(f); 
packaged _ task<PTT> job2(G{}); 
packaged task<PTT> job3(h); 


auto f1 = job1.get future(); 
auto f2 = job2.get_future(); 
auto f3 = job3.get_future(); 


server.put(move(job1)); 
server.put(move(job2)); 
server.put(move(job3)); 


auto r1 = f1.get(); 
auto r2 = f2.get(); 
auto r3 = f3.get(); 


服务 器 thread 会 从 server 队列 接受 packaged_task 并 以 某 种 恰当 的 顺序 执行 它们 。 通 常 ， 
任务 会 从 调用 上 下 文 携带 数据 。 

任务 的 编写 本 质 上 类 似 普通 函数 、 函 数 对 象 和 lambda， 服 务 器 调用 任务 也 很 类 似 普 通 
(回调 ) 函数 。 对 服务 器 而 言 ，packaged _ task 确实 比 普通 函数 更 易 使 用 ， 因 为 已 经 考虑 了 
异常 处 理 。 


42.4.4 future 


future 就 是 共享 状态 的 句柄 ( 见 42.4.1 节 )， 它 是 任务 提取 由 promise ( 见 42.4.2 节 ) 存 
放 的 结果 的 地 方 。 
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future<T> (iso.30.6.6 ) 


future fu {}; 默认 构造 函数 : 无 共享 状态 ; 不 抛 出 异常 
future fu {fu2}; 移动 构造 函数 : fu 获得 fu2 的 共享 状态 (如 果 有 的 话 ); fu2 不 再 包含 共享 状态 ; 不 抛 出 异常 
fu.-future() 析 构 函数 : 释放 共享 状态 (如 果 有 的 话 ) 


fu=move(fu2) 移动 赋值 : fu 获得 fu2 的 共享 状态 (如 果 有 的 话 ) ; fu2 不 再 包含 共享 状态 ; 释放 f 的 旧 共 
享 状态 (如果 有 的 话 ) 
sf=fu.share() 将 fu 的 值 移入 一 个 shared_future sf; fu 不 再 包含 共享 状态 


x=fu.get() fu 的 值 被 移 人 x ; 如果 中 保存 的 是 一 个 异常 ， 抛 出 它 ; fu 不 再 包含 共享 状态 ; 不 要 尝试 
get() 两 次 

fu.get() 对 future<void>: 类 似 x=fu.get()， 但 不 移动 任何 值 

fu.valid() fu 有效 吗 ? 即 ， 人 fu 包含 一 个 共享 状态 吗 ? 不 抛 出 异常 

fu.wait() 阻塞 ， 直 至 有 一 个 值 到 来 


fs=fu.wait_ 阻塞 ， 直 至 有 一 个 值 到 来 或 经 过 duration d; fs 确定 是 一 个 值 准备 好 (ready)、 发 生 timeout 
for(d) 还 是 执行 被 推迟 

fs=fu.wait_ 阻塞 ， 直 至 有 一 个 值 到 来 或 到 达 time_point tp ; fs 确定 是 一 个 值 准 备 好 (ready)、 发 生 
until(tp) timeout 还 是 执行 被 推迟 


future 保存 一 个 独一无二 的 值 ， 它 并 不 提供 拷贝 操作 。 

如 果 future 保存 了 一 个 值 ， 它 只 能 被 移出 。 因 此 get() 只 能 被 调用 一 次 。 如 果 你 可 能 需 
要 多 次 读 取 一 个 结果 (例如 ， 多 个 任务 都 读 取 结果 )， 应 使 用 shared_future ( 见 42.4.5 节 )。 

如 果 你 尝试 调用 get() 两 次 ,结果 是 未 定义 的 。 实 际 上 ， 对 一 个 非 valid() 的 future， 
除了 首次 get() 、valid() 或 析 构 函数 ， 其 他 任何 操作 的 结果 都 是 未 定义 的 。 对 于 这 种 情况 ， 
C++ 标准 “鼓励 ” 抛 出 一 个 错误 状态 为 future_errc::no_state 的 future_error。 

如 果 future<T> 的 值 类 型 T 为 void 或 一 个 引用 ， 则 对 get() 应 采用 特殊 规则 : 

e future<void>::get() 不 返回 值 : 它 简单 返回 到 调用 者 或 抛 出 一 个 异常 。 

e future<T&>::get() 返回 一 个 T&。 引 用 不 是 对 象 ， 因 此 标准 库 必 定 传递 的 是 其 他 什么 

东西 ， 例 如 一 个 T*，get() 将 其 转换 ( 回 ) 一 个 T&。 

我 们 可 以 调用 wait for() 和 wait_until() 来 获得 future 的 状态 : 


enum class future_status 





ready future 已 包含 一 个 值 
timeout 操作 超时 
deferred future 的 任务 被 推迟 执行 ， 直 至 调用 了 get() 


future 上 的 操作 可 能 产生 如 下 错误 : 


future 错误 : future_errc 





broken_promise promise 在 提供 值 之 前 就 丢弃 了 状态 

future_already_retrieved 对 future 第 二 次 执行 get() 

promise_already_satisfied ”对 promise 第 二 次 执行 set_value() 或 set_exception() 

no_state 操作 在 promise 的 共享 状态 创建 前 就 试图 访问 它 (例如 get_future() 或 set_value()) 


此 外 ，shared_future<T>::get() 的 类 型 为 的 值 上 的 操作 可 能 出 异常 (例如 ， 一 个 不 寻常 
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的 移动 操作 )。 
检查 future<T> 表 ， 我 发 现 我 漏 掉 了 两 个 有 用 的 函数 : 
e wait_for_all(args): 等 待 ， 直 至 args 中 每 个 future 都 有 了 一 个 值 。 
e wait for_any(args): 等 待 ， 直 至 args 中 某 个 future 有 了 一 个 值 。 
我 可 以 很 简单 地 实现 一 个 wait_for_all(): 


template<typename T> 
vector<T> wait_for_all(vector<future<T>>& vf) 


{ 
vector<T> res; 
for (auto& fu : vf) 
res.push_back(fu.get()); 
return res; 
} 


这 个 版 本 使 用 起 来 足够 简单 ， 但 它 有 一 个 缺陷 : 如 果 我 等 待 10 个 future， 那 么 我 的 thread 
就 有 阻塞 10 次 的 风险 。 理 想 情 况 是 ,我 的 thread 最 多 阻塞 和 解除 阻塞 一 次 。 但 对 于 很 多 应 
用 来 说 ， 这 个 版 本 的 wait_for_all() 已 经 足够 好 了 : 如 果 某 些 任务 是 长 时 间 运 行 的 ， 那 么 额 
外 的 等 待 就 不 那么 严重 了 。 另 一 方面 ， 如 果 所 有 任务 运行 时 间 都 很 短 ， 那 么 它们 很 可 能 在 第 
一 次 等 待 后 就 很 快 结束 了 。 

wait_for_any() 的 实现 更 复杂 一 些 。 首 先 我 们 需要 一 种 检查 future 是 否 就 绪 的 方法 。 令 
人 惊讶 的 是 ， 这 可 以 通过 wait_for() 实现 。 例 如 : 


future_status s = fu.wait_for(seconds{0}); 


用 wait_for(seconds{0}) 获取 future 的 状态 不 是 那么 显而易见 的 ， 但 wait_for() 会 告诉 我 们 
它 为 什么 恢复 ， 并 在 暂停 之 前 检测 是 否 就 绪 。wait_for(seconds{0}) 会 立即 返回 ， 而 不 是 尝 
试 暂停 零 时 长 。 

有 了 wait_for()， 我 们 可 以 编写 下 面 的 代码 : 


template<typename T> 

int wait_for_any(vector<future<T>>& vf, steady_clock::duration d) 
/返回 就 绪 的 future 的 索引 
外 如 无 future 就 绕 ， 等 待 时 长 d 之 后 再 尝试 


while(true) { 
for (int i=0; il=vf.size(); ++i) { 

if (Ivf[il].valid()) continue; 

switch (vf[i].wait_for(seconds{0})) { 

case future_status::ready: 
return i; 

case future_ status::timeout: 
break; 

case future_status::deferred: 
throw runtime_error("wait_for_all(): deferred future"); 


} 


this_thread::sieep_for(d); 
} 
} 
对 于 我 的 用 途 ， 我 将 推迟 (deferred) 的 任务 ( 见 42.4.6 节 ) 视 为 一 个 错误 。 
注意 valid() 检测 。 试 图 对 一 个 不 合法 的 future( 例 如， 已 经 执行 了 一 次 get() 的 future) 执 
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行 wait_for() 会 导致 难以 查找 的 错误 ， 最 好 的 情况 也 只 能 是 抛 出 一 个 (可 能 出 乎 意料 的 ) 异常 。 
类 似 wait_for_all() 的 实现 ， 这 个 实现 也 有 一 个 缺陷 : 理想 情况 下 ，wait_for_any() 的 
调用 者 永远 不 应 被 无 用 地 唤醒 一 一 唤醒 后 只 是 发 现 还 没有 任务 完成 ， 而 且 应 该 在 某 个 任务 完 
成 后 立即 被 唤醒 。 这 个 简单 实现 只 是 接近 了 这 一 目标 。 如 果 使 用 很 大 的 d， 无 用 唤醒 的 可 能 
性 变 得 很 低 ， 但 有 可 能 不 必要 地 等 待 很 长 时 间 。 
函数 wait_for_all() 和 wait_for_any() 是 构建 并 发 算法 的 基石 。 我 在 42.4.7 节 中 会 用 到 
它们 。 


42.4.5 shared _ future 


future 的 结果 值 只 能 被 读 取 一 次 ， 因 为 读 取 时 它 就 被 移动 了 。 因 此 ， 如 果 你 希望 反复 读 
取 结 果 值 ， 或 是 可 能 有 多 个 读者 读 取 结果 ， 就 必须 拷贝 它 ， 然 后 读 取 副 本 。 这 正 是 shared_ 
future 所 做 的 。 每 个 可 用 的 shared_future 都 是 通过 直接 或 间接 地 从 具有 相同 结果 类 型 的 
future 中 移出 值 来 进行 初始 化 的 。 


shared_future<T> (iso.30.6.7 ) 
shared_future sf {}; 默认 构造 函数 : 无 共享 状态 ; 不 抛 出 异常 
shared_future sf {fu}; 构造 函数 : 从 future fu 移动 值 ; fu 不 再 包含 状态 ; 不 抛 出 异常 
shared_future sf {sf2}; 拷贝 和 移动 构造 函数 ;移动 构造 函数 不 抛 出 异常 





sf.“future() 析 构 函数 : 释放 共享 状态 (如果 有 的 话 ) 

sf=sf2 拷贝 赋值 操作 

sf=move(sf2) 移动 赋值 操作 : 不 抛 出 异常 

x=sf.get() sf 的 值 被 拷贝 到 x; 如果 sf 中 保存 的 是 一 个 异常 ， 抛 出 它 
sf.get() 对 shared_future<void>: 类 似 x=sf.get()， 但 不 拷贝 任何 值 
sf.valid() sf 有 共享 状态 吗 ? 不 抛 出 异常 

sf.wait() 阻塞 ， 直 至 有 一 个 值 到 来 





阻塞 ， 直 至 有 一 个 值 到 来 或 等 待 duration d ; fs 辨别 一 个 值 是 否 准备 好 (ready)、 
发 生 一 个 timeout 还 是 执行 被 推迟 (deferred ) 

阻塞 ， 直至 有 一 个 值 到 来 或 等 到 time_point tp ; fs 辨别 一 个 值 是 否 准 备 好 
(ready)、 发 生 一 个 timeout 还 是 执行 被 推迟 (deferred) 


fs=sf.wait_for(d) 


fs=sf.wait_until(tp) 


显然 ，shared_future 与 future 非常 相似 。 关 键 差 别 是 shared_future 将 其 值 移动 到 可 以 被 
反复 读 取 及 共享 的 位 置 。 类 似 future<T>， 如 果 shared_future<T> 的 值 类 型 TT 为 void 或 引 
用 ， 则 对 其 get() 应 用 特殊 规则 : 

e@ shared future<void>::get() 不 返回 值 ， 它 简单 返回 到 调用 者 或 抛 出 一 个 异常 。 

@ shared future<T&>::get() 返回 一 个 T&。 引 用 不 是 对 象 ， 因 此 标准 库 必 定 传递 的 是 其 

他 什么 东西 ， 例 如 一 个 Ts ，get0 将 其 转换 ( 回 ) 一 个 T&。 

@ 若 工 不 是 引用 ，shared future<T>::get( 返回 一 个 const T&。 
除非 返回 对 象 是 引用 ， 否则 它 将 是 const 的 ， 因 此 多 个 thread 可 以 不 借助 同步 就 能 安全 访 
问 它 。 如 果 返 回 对 象 是 一 个 非 const 引用 ， 你 需要 某 种 形式 的 互 斥 机 制 来 避免 访问 引用 对 象 
时 发 生 数 据 范 争 。 


42.4.6 async() 
有 了 future 和 promise ( 见 42.4.1 节 ) 以 及 packaged_task ( 见 42.4.3 节 )， 我们 就 可 以 
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编写 简单 的 任务 而 不 必 过 于 担心 thread 了。 借助 这 些 特性 ，thread 只 不 过 是 你 给 定 任务 去 
执行 的 载体 而 已 。 但 是 ,我 们 仍 需 考虑 使 用 多 少 个 thread 以 及 任务 是 由 当前 thread 运行 还 
是 由 其 他 thread 运行 。 这 种 决策 可 交 给 线程 启动 器 ( thread launcher) 完成 ， 这 是 一 个 函数 ， 
它 决 定 是 否 创建 一 个 新 thread 、 回 收 一 个 旧 thread 或 简单 地 在 当前 thread 上 运行 任务 。 


异步 任务 启动 器 : async<F,Args> (iso.30.6.8 ) 
fu=async(policy,f,args) 根据 启动 策略 policy 执行 f(args) 
fu=async(f,args) fu=async(launch::asyncllaunch::deferred,f,args) 


async() 基本 上 可 看 作 一 个 复杂 启动 器 的 简单 接口 。 调 用 async() 返回 一 个 future<R>， 其 
中 R 的 类 型 与 其 任务 的 返回 类 型 相同 。 例 如 : 
double square(int i) { return i*i; } 


future<double> fd = async(square,2); 
double d = fd.get(); 


如 果 启 动 一 个 thread 执行 square(2)， 我 们 可 能 得 到 一 种 执行 2*2 的 创 纪录 的 缓慢 方法 。 使 
用 auto 可 以 简化 符号 表示 : 
double square(int i) { return ix*i; } 


auto fd = async(square,2); 
auto d = fd.get(); 


一 般 来 说 ，async() 的 调用 者 可 能 提供 各 种 信息 帮助 async() 的 实现 决定 是 否 启动 一 个 新 
thread， 还 是 简单 地 在 当前 thread 上 执行 任务 。 例 如 ， 我 们 容易 想象 程序 员 会 希望 为 启动 
器 提供 一 个 任务 可 能 运行 多 长 时 间 的 提示 。 但 是 ， 当 前 的 C++ 标准 只 提供 了 两 种 策略 : 





启动 策略 : launch 
async 就 像 创建 了 一 个 新 thread 执行 任务 一 样 
deferred 在 对 任务 的 future 执行 get() 的 时 刻 执 行 任 务 


注意 “就 像 ”。 对 于 是 否 启 动 一 个 新 thread， 启 动 器 有 很 宽 的 自由 裁定 权力 。 例 如 ， 由 于 
默认 策略 是 asyncldeferred (async 或 deferred)， 一 次 async(square ,2) 调用 决定 采用 
deferred 策略 并 不 稀奇 ， 从 而 任务 的 执行 变 为 由 fd.get() 调用 square(2)。 我 甚至 可 以 想象 
优化 器 会 将 整个 代码 片段 优化 为 

double d = 4; 

但 是 ， 我 们 不 能 期 望 async() 的 实现 会 针对 这 样 简单 的 的 例子 进行 优化 。 实 现 者 的 付出 最 好 
花 在 实际 的 例子 上 ， 即 任务 会 执行 大 量 计算 ， 从 而 可 以 合理 地 考虑 是 启动 一 个 新 thread 还 
是 一 个 “回收 再 利用 ”的 thread 。 

“回收 再 利用 的 thread” 的 意思 是 来 自 一 大 批 thread (线程 池 ) 中 的 一 个 thread， 
async() 可 以 只 创建 它 一 次 然后 反复 使 用 它 执 行 不 同 任务 。 依 赖 于 系统 线程 的 实现 ， 这 种 机 
制 可 以 大 幅度 地 降低 在 thread 上 执行 任务 的 代价 。 如 果 一 个 thread 被 回收 ， 启 动 器 必须 小 
心 ， 不 能 让 一 个 任务 看 到 运行 在 此 thread 上 的 前 一 个 任务 的 残留 状态 ， 也 不 能 让 一 个 任务 
将 指向 其 栈 或 thread_local 数据 的 指针 ( 见 42.2.8 节 ) 保存 在 非 局 部 存储 中 。 可 以 想象 这 种 
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数据 会 用 于 安全 攻击 。 
async() 的 一 个 简单 但 实际 的 用 途 是 创建 任务 收集 用 户 输入 : 
void user() 
{ 


auto handle = async([](){ return input_interaction_manager(); }); 
5 input = handle.get(); 
Wh 

} 

这 种 任务 通常 要 求 来 自 调 用 者 的 一 些 数据 。 我 使 用 了 一 个 lambda 来 表示 任务 ， 以 明确 我 可 
以 传递 参数 或 允许 访问 局 部 变量 。 当 使 用 lambda 指定 任务 时 ， 要 小 心 引用 方式 的 局 部 变量 
捕获 。 这 可 能 导致 访问 相同 栈 框架 的 两 个 thread 产生 数据 竞争 或 糟糕 的 缓存 访问 模式 。 还 
要 小 心 使 用 [this] 捕获 对 象 的 成 员 ( 见 11.4.3.3 节 )， 这 意味 着 对 象 成 员 是 被 (通过 this) 间 
接 访 问 ， 而 不 是 拷贝 的 ， 从 而 对 象 很 容易 产生 数据 竞争 ， 除 非 你 确认 不 会 产生 。 如 果 有 疑 
问 ， 就 采用 拷贝 方式 〈 传 值 方式 传递 参数 或 捕获 局 部 变量 ，[=])。 

能 选择 “延迟 ”调度 策略 并 按 需 修改 通常 是 很 重要 的 。 例 如 ， 我 们 可 能 在 初始 调试 时 使 
用 launch::deferred， 这 样 ， 在 消除 串 行 错误 之 后 ， 才 会 消除 并 发 相关 的 错误 。 而 且 ， 我 可 
以 经 常 回 到 launch::deferred 状态 ， 以 确定 一 个 错误 是 否 真 的 与 并 发 有 关 ( 见 42.4 节 )。 

随 着 时 间 推 移 ， 会 有 更 多 的 启动 策略 加 入 C++ 中 ,而 且 有 些 系统 可 能 提供 更 好 的 启动 
策略 。 这 样 ， 我 就 可 能 通过 局 部 改变 启动 策略 而 不 是 重 写 程序 逻辑 的 微妙 细节 来 提高 代码 的 
性 能 。 这 再 次 体现 了 基于 任务 的 模型 的 根本 一 一 简单 性 一 一 的 效果 ( 见 42.4 亨 )。 

将 launch::deferred 作为 默认 启动 策略 会 带 来 一 个 实际 问题 。 基 本 上 ， 这 与 其 说 是 一 个 
默认 设置 ， 倒 不 如 说 是 一 个 缺乏 设计 的 策略 。 一 个 实现 可 能 决定 “无 并 发 ”是 一 个 好 主意 ， 
并 一 直 使 用 launch::deferred。 如 果 你 在 实验 中 发 现 并 发 的 结果 与 执行 单线 程 惊人 相似 ， 可 
尝试 显 式 设 定 启动 策略 。 


42.4.7 ”一 个 并 行 find() 示例 


find() 对 序列 进行 线性 搜索 。 想 象 序列 中 有 数 百 万 个 元 素 ， 难 以 排序 ， 从 而 find() 就 成 
为 查找 元 素 的 恰当 算法 。 它 可 能 很 慢 ， 因 此 我 们 不 是 从 头 到 尾 依次 搜索 ， 而 是 启动 100 个 
find()， 每 个 负责 1% 数据 的 搜索 。 

首先 ,我们 将 数据 表示 为 一 个 Record 的 vector: 


extern vector<Record> goods; // 要 搜索 的 数据 


单个 〈 串 行 ) 任务 可 以 简单 地 使 用 标准 库 find_if() 完成 : 


template<typename Pred> 
Record* find_rec(vector<Record>& vr int first, int last, Pred pr) 








{ 
vector<Record>::iterator p = std::find_if(vr.begin()+first,vr.begin()+last,pr); 
if (p == vr.begin()+last) 
return nullptr; | 到达 末尾 : 未 找到 记录 
return &:*p; 咱 找 到; 返回 指向 元 素 的 指针 
} 


不 幸 的 是 ， 我 们 必须 决定 并 行 的 “粒度 ”。 即 ， 我 们 需要 指定 顺序 搜索 的 记录 数 : 
const int grain = 50000; 儿 线性 搜索 的 记录 数 








选 定 这 样 一 个 数 是 一 种 非常 原始 的 选择 粒度 大 小 的 方法 。 挑 选 一 个 很 好 的 数 非常 困难 ， 除 非 
对 硬件 、 库 实现 、 数 据 以 及 算法 有 很 多 的 了 解 ， 而 且 必 须 进行 实验 。 能 帮助 我 们 避免 粒度 选 
择 或 能 帮助 我 们 选择 合适 粒度 的 工具 和 框架 很 有 用 。 但 是 ， 本 节 只 是 简单 展示 一 个 基本 标准 
库 特 性 及 其 最 基本 的 使 用 技术 ， 对 此 grain 已 经 足够 了 。 

函数 pfind() (“并 行 查找 ”) 简单 进行 多 次 async() 调用 ， 具 体 次 数 由 grain 和 Record 
的 数量 决定 。 然 后 ， 它 利用 get() 得 到 结果 : 


template<typename Pred> 
Record* pfind(vector<Record>& vr, Pred pr) 


{ 
assert(vr.size()%grain==0); 
vector<future<Record+>> res; 
for (int i = 0; il=vr.size(); i+=grain) 
res.push_ back(asyncl(find_rec<Pred>,ref(vr),i,itgrain,pr)); 
for (int i = 0; il=res.size(); ++i) 中 在 futures 中 查找 结果 
if (auto p = res[il.get()) /此 任务 找到 匹配 结果 了 吗 ? 
return p; 
return nuliptr; 省 未 找到 匹配 结果 


最 终 ， 我 们 可 以 发 起 一 次 搜索 : 
void find_cheap_red() 
{ 


assert(goods.size()%grain==0); 


Record* p = pfind(goods, 
D(Record& r) { return r.price<200 && r.color==Color::red; }); 
cout << "record "<< *p << \n’; 


} 


并 行 find() 的 这 第 一 个 版 本 首先 创建 很 多 任务 ， 然 后 按 顺 序 等 竺 它们 完成 。 类 似 std::find_ 
if()， 它 报告 与 谓词 匹配 的 第 一 个 元 素 ; 即 ， 下 标 最 小 的 匹配 元 素 。 这 个 版 本 可 能 很 好 ， 但 是 : 
e 我 们 最 终 可 能 等 待 很 多 未 找到 任何 东西 的 任务 (可 能 只 有 最 后 一 个 任务 找到 匹配 元 素 )。 
e 我 们 可 能 错过 很 多 或 许 有 用 的 信息 (可 能 有 上 千 项 匹配 我 们 的 搜索 标准 )。 
第 一 个 问题 可 能 并 不 像 听 起 来 那么 糟糕 。 假 定 (有些 鲁莽 地 ) 启动 一 个 thread 不 会 产生 什么 
代价 ， 并 假定 我 们 拥有 与 任务 一 样 多 的 处 理 单元 。 即 ， 我 们 获得 结果 所 花费 的 时 间 可 能 是 检 
查 50000 个 记录 而 非 百 万 个 记录 所 用 的 时 间 。 如 果 我 们 有 N 个 处 理 单元 ， 将 会 以 N*50000 
个 记录 一 批 逐 批 地 获得 结果 。 如 果 直 到 vector 的 最 后 一 段 也 未 找到 匹配 记录 ， 则 花费 大 约 
vr.size()/(N*grain) 个 单位 时 间 。 
我 们 可 以 不 必 按 顺序 等 待 每 个 任务 完成 ， 而 是 尝试 按 任 务 完 成 的 顺序 查看 结果 ， 即 使 用 
wait for_ any() ( 见 42.4.4 节 )。 例 如 : 


template<typename Pred> 
Record* pfind_any(vector<Record>& vr, Pred pn 


{ 


vector<future<Record:>> res; 


for (int i = 0; il=vr.size(); i+=grain) 
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res.push_back(async(find_rec<Pred>,ref(vr),i,i+grain, pr)); 


for (int count = res.size(); count; --count){ 
inti= wait_for_any(res,microseconds{10}); ”// 某 个 任务 完成 


if (auto p = resfi].get()) 放 此 任务 找到 匹配 结果 了 吗 ? 
return p; 
} 
return nullptr; 儿 未 找到 匹配 结果 





} 
调用 get() 会 使 其 future 变 为 无 效 ， 因 此 我 们 不 能 两 次 查看 一 个 部 分 结果 。 
” ”我 使 用 count 确保 所 有 任务 都 报告 结果 后 就 不 会 继续 查看 了 。 除 此 之 外 ，pfind_any() 
与 pfind() 一 样 简 单 。pfind_any() 与 pfind() 相 比 是 否 有 性 能 优势 依赖 于 很 多 因素 ， 但 关键 
的 观察 结果 是 ， 为 了 从 并 发 获得 (可 能 的 ) 性 能 提升 ， 必 须 使 用 一 个 稍微 不 同 的 算法 。 类 似 
find_if(), pfind() 返回 第 一 个 匹配 结果 ， 而 pfind_any() 返回 的 则 是 它 找到 的 第 一 个 匹配 结果 。 
一 个 问题 的 最 住 并 行 算法 通常 是 其 串 行 解决 思想 的 变 体 ， 而 不 是 简单 重复 串 行 解决 方案 。 

在 此 情况 下 ， 一 个 显而易见 的 问题 是 “你 真 的 只 需要 一 个 匹配 结果 吗 ?” 使 用 并 发 ， 查 
找 所 有 匹配 结果 就 变 得 更 有 意义 了 。 实 现 这 一 目标 很 容易 ， 我 们 所 要 做 的 只 是 令 每 个 任务 返 
回 一 个 匹配 结果 的 vector， 而 不 只 是 单一 匹配 结果 : 


template<typename Pred> 
vector<Record:*> find_all_rec(vector<Record>& vr, int first, int last, Pred pr) 


{ 
vector<Record*> res; 
for (int i=first; i!l=last; ++i) 
if (pr(vrfi])) 
res.push_back(&vr[i]); 
return res; 
} 


此 find_all_rec() 可 以 说 比 最 初 的 find_rec() 更 为 简单 。 
现在 只 需 恰 当地 多 次 启动 find_all_rec() 并 等 待 结果 : 


template<typename Pred> 
vector<Record:> pfind_all(vector<Record>& vr, Pred pr) 


{ 
vector<future<vector<Record*>>> res; 
for (int i = 0; il=vr.size(); i+=graim) 
res.push_back(async(find_all_rec<Pred>,ref(vr),i,itgrain, pr)); 
vector<vector<Record:*>> r2 = wait_for_all(res); 
vector<Record*> 六 
for (auto& x : r2) 川 合并 结果 
for (auto p : x) 
r.push_back(p); 
return r; 
} 


假如 只 是 返回 一 个 vector<vector<Record*>>， 此 pfind_all() 会 是 目前 为 止 最 简单 的 并 行 函 
数 。 但 是 ， 通 过 将 返回 的 多 个 vector 合并 为 单一 向 量 ，pfind_all() 展示 了 一 类 常见 和 流行 的 
并 行 算法 : 
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[1] 创建 一 些 待 运行 的 任务 。 

[2 ] 并 行 运行 这 些 任务 。 

[3] 合并 结果 。 
在 开发 能 完全 隐藏 并 发 执行 细节 的 框架 时 ， 这 是 一 种 基本 思想 ， 它 常 被 称 为 map-reduce 
[Dean, 2004]。 

运行 实例 可 能 如 下 所 示 : 

void find_all_cheap_red() 


{ 
assert(goods.size()%grain==0); 
auto vp = pfind_all(goods, 
[(Record& r) { return rprice<200 && r.color==Color::red; }); 
for (auto p : vp) 
cout << "record "<< *p << \n'; 
} 


最 终 ， 我 们 必须 考虑 为 并 行 化 所 付出 的 努力 是 否 值得 。 为 此 ， 我 向 测试 程序 中 添加 了 简单 的 
串 行 版 本 : 


void just find_cheap_red() 


{ 
auto p = find_if(goods.begin(),goods.end!(), 
[I(Record& mn { return r.price<200 && r.color==Color::red; }); 
if (p!=goods.end!()) 
Cout << "record "<< *p << \n'; 
else 
cout << "not found\n"; 
} 
void just_ find_alL_cheap_red() 
{ 
auto vp =find_all_rec(goods,0,goods.size()， 
[I(Record& r) { return r.price<200 && r.color==Color::red; )); 
for (auto p : vp) 
cout << "record "<< *p << \n’; 
} 


对 于 我 使 用 的 简单 测试 数据 和 我 的 (相对 ) 简单 的 只 有 四 个 硬件 线程 的 笔记 本 电脑 而 言 ， 我 
并 未 发 现 两 个 版 本 有 任何 一 致 或 显著 的 性 能 差异 。 在 本 例 中 ， 不 成 熟 的 async() 实现 创建 
thread 的 代价 主导 了 并 发 的 效果 。 如 果 我 希望 马上 获得 显著 的 并 行 加 速 比 ， 可 以 基于 一 组 
预 创建 的 thread 和 一 个 工作 队列 ， 沿 着 Sync_queue ( 见 42.3.4 节 ) 和 packaged task ( 见 
42.4.3 节 ) 的 路 线 实现 自己 版 本 的 async()。 注 意 ， 这 种 显著 的 优化 工作 无 需 改 变 基 于 任务 
的 并 行 pfind() 程序 。 从 应 用 程序 的 角度 ， 将 标准 库 async() 替换 为 一 个 优化 版 本 属于 实现 
细节 范畴 。 


42.5 建议 


[1] thread 是 系统 线程 的 类 型 安全 的 接口 ; 42.2 节 。 

[2] 不 要 销毁 正在 运行 的 thread; 42.2.2 节 。 

[3] 用 join() 等 待 thread 结束 ; 42.2.4 节 。 

[4] 考虑 使 用 guarded_ thread 为 thread 提供 RAII; 42.2.4 市 。 
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除非 不 得 已 ， 否 则 不 要 detach() 一 个 thread; 42.2.4 节 。 
用 lock_guard 或 unique_lock 管理 互 斥 量 ; 42.3.1.4 节 。 
用 lock() 获取 多 重 锁 ; 42.3.2 节 。 
用 condition_variable 管理 thread 间 通 信 ; 42.3.4 节 。 
从 并 发 执行 任务 的 角度 思考 ， 而 非 直 接 从 thread 角度 思考 ; 42.4 节 。 
重视 简洁 性 ; 42.4 节 。 
用 promise 返回 结果 ， 从 future 获取 结果 ; 42.4.1 节 。 
不 要 对 一 个 promise 两 次 执行 set_value() 或 set _ exception(); 42.4.2 节 。 
用 packaged_task 管理 任务 抛 出 的 异常 以 及 安排 返回 值 ; 42.4.3 节 。 
用 packaged _ task 和 future 表达 对 外 部 服务 的 请 求 以 及 等 待 其 应 答 ; 42.4.3 节 。 


] 不 要 从 一 个 future 两 次 使 用 get(); 42.4.4 节 。 
] 用 async() 启动 简单 任务 ; 见 42.4.6 节 。 
] 选择 好 的 并 发 粒度 很 困难 : 依赖 实验 和 测量 做 出 选择 ; 见 42.4.7 节 。 


尽量 将 并 发 隐藏 在 并 行 算法 接口 之 后 ; 见 42.4.7 节 。 


] 并 行 算 法 在 语义 上 可 能 与 解决 同一 问题 的 串 行 解决 方案 不 同 (如 pfind_all() 对 


find()); 见 42.4.7 节 。 


] 有 时 ， 串 行 解决 方案 比 并 行 版 本 简单 且 快 速 ;， 见 42.4.7 节 。 
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C 是 一 种 强 类 型 、 弱 检查 的 语言 。 
一 一 丹尼斯 . 麦 卡 利 斯 特 . 里 奇 


引言 

文件 

printf() 系列 函数 
C 风格 字符 串 
内 存 
日 期 和 时 间 
杂项 


e 建议 


43.1 引言 


C 标准 库 经 过 很 小 改动 后 已 被 纳入 C++ 标准 库 中 。C 标准 库 提供 了 一 些 多 年 来 已 在 很 
多 领域 被 证 明 很 有 用 的 困 数 ， 这 些 冰 数 在 相对 低层 的 编程 中 尤为 重要 。 

还 有 很 多 C 标准 库 函 数 本 章 未 能 介绍 ; 如 需 了 解 这 些 内 容 ， 请 参考 一 本 好 的 C 语言 
材 ， 如 “Kernighan 和 Ritchie”| Kernighan，1988 ] 或 ISO C 标准 库 [ C，2011 ]。 


43.2 文件 


C LO 系统 是 基于 文件 的 。 一 个 文件 (FILE*) 可 以 指向 一 个 外 存 文件 或 一 个 标准 输入 输 
出 流 : stdin 、stdout 及 stderr。 标 准 流 都 是 默认 可 用 的 ， 其 他 文件 则 需 打 开 才 能 使 用 : 





文件 打开 和 关闭 
f=fopen(s,m) 为 一 个 名 为 s 的 文件 打开 一 个 文件 流 ， 打 开 模 式 为 m， 若 成 功 , f 为 对 应 打开 文件 的 FILE*， 
否则 f 为 nullptr 
x=fclose(f) 关闭 文件 流 f; 若 成 功 返 回 0 








用 fopen() 打开 的 文件 必须 用 fclose() 关闭 ， 否 则 文件 会 保持 打开 状态 直至 操作 系统 关闭 
它 。 如 果 你 认为 这 是 一 个 问题 (将 其 视 为 一 种 资源 泄漏 )， 可 使 用 fstream ( 见 38.2.1 节 )。 

模式 (mode) 是 一 个 C 风格 字符 串 ， 包 含 一 个 或 多 个 字符 ， 指 明文 件 如 何 打开 (以 及 打 
开 后 如 何 使 用 ): 


文件 模式 
Fe 读 

Ww 写 (丢弃 原 有 内 容 ) 
"a" 追加 (添加 在 末尾 ) 
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文件 模式 
i 读 写 
i 读 写 (丢弃 原 有 内 容 ) 
by 二 进 制 ， 与 其 他 模式 一 起 使 用 


在 特定 系统 中 ， 可 能 有 (通常 确实 有 ) 更 多 选项 。 例 如 ，x 有 时 用 来 表示 “在 此 打开 操作 之 
前 文件 不 能 存在 ”。 某 些 选 项 可 以 组 合 使 用 ， 例 如 ，fopen("foo","rb") 尝试 打开 一 个 名 为 foo 
的 文件 ， 进 行 二 进 制 读 取 。LO 模式 对 stdio 和 iostream ( 见 38.2.1 节 ) 应 该 是 一 致 的 。 


43.3 printf() 系列 函数 


最 流行 的 C 标准 库 函 数 是 输出 函数 。 但 是 ， 我 倾向 于 使 用 iostream 库 ， 因 为 它 是 类 型 
安全 且 可 扩展 的 。 格 式 化 输出 函数 printf() 已 被 广泛 使 用 (包括 用 于 C++ 程序 中 )， 还 被 其 他 
编程 语言 广 为 效 仿 : 


printf() 
n=printf(fmt,args) 根据 格式 化 字符 串 fmt 将 参数 args 恰当 插入 ， 打 印 到 stdout 
n=fprintf(f,fmt,args) 根据 格式 化 字符 串 fmt 将 参数 args 恰当 插入 ， 打 印 到 文件 f 
n=sprintf(s,fmt,args) 根据 格式 化 字符 串 fmt 将 参数 args 恰当 插入 ， 打 印 到 C 风格 字符 串 s 


在 每 个 版 本 中 ,n 都 得 到 输出 的 字符 数 ， 或 者 是 一 个 负数 表示 输出 失败 。 我 们 通常 会 忽略 
printf() 的 返回 值 。 
printf() 的 声明 为 : 


int printf(const char* format ...); 


换 句 话说 ， 它 接受 一 个 C 风格 字符 串 (通常 是 一 个 字符 串 字面 值 常量 )， 然 后 是 任意 数量 、 
任意 类 型 的 实 参 。 这 些 “ 额 外 实 参 ”的 含义 由 格式 字符 串 中 的 转换 说 明 控制 ， 如 %c (打印 
为 字符 ) 和 %d (打印 为 十 进 制 整数 )。 例 如 : 

int x = 5; 

const char* p = "Pedersen"; 

printf("the value of x is '%d' and the value of s is '"%s'"\n",x,s); 


紧 跟 % 的 字符 控制 实 参 的 处 理 。 第 一 个 % 用 于 第 一 个 “额外 实 参 " (在 本 例 中 是 %d 用 于 x)， 
第 二 个 % 用 于 第 二 个 “额外 实 参 ” (在 本 例 中 是 %s 用 于 s)， 以 此 类 推 。 这 个 printf() 调用 的 
输出 结果 是 : 

the value of x is '5' and the value of s is "Pedersen' 
后 接 一 个 换行 。 

一 般 而 言 ， 编 译 器 不 能 检查 一 个 % 转换 指令 与 其 应 用 的 类 型 间 的 对 应 关系 ， 即 使 能 检 
查 ， 通 常 也 不 会 这 样 做 。 例 如 : 


printf("the value of x is '%s' and the value of s is "%x"\n",x,s); 儿 糟糕 


转换 说 明 非 常 多 (而 且 还 在 继续 增加 )， 而 且 灵 活 度 非常 大 。 很 多 系统 都 支持 超出 C 标准 之 
外 的 选项 。 可 参考 用 于 strftime() 格式 化 的 选项 集合 ( 见 43.6 节 )。 下 面 是 选项 列表 (% 后 
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的 字符 ) 及 其 说 明 : 


十 
0 
# 


可 选 的 减 号 ， 指 定 转 换 的 值 在 域内 左 对 齐 ; 

可 选 的 加 号 ， 指 出 带 符 号 类 型 的 值 总 是 以 + 或 -符号 开始 ; 

可 选 的 零 ， 指 出 用 前 导 零 填充 数值 的 输出 。 如 果 指 定 了 - 或 精度 ， 则 0 被 忽略 ; 

可 选 的 #， 指 出 即使 一 个 浮 点 数 在 小 数 点 后 无 非 零 数 字 ， 也 要 打印 小 数 点 ， 尾 置 的 
零 要 打印 出 来 ， 八 进 制 值 要 打印 一 个 起 始 0， 十 六 进 制 值 要 打印 一 个 起 始 0x 或 0X; 
可 选 的 数字 字符 串 ， 指 定 域 宽度 ; 如 果 转 换 值 的 字符 串 小 于 域 宽 ， 则 在 左 侧 (或 右 
侧 ， 若 给 出 了 左 对 齐 指示 符 的 话 ) 填充 空格 以 补足 域 宽 ;如 果 域 宽 以 零 开头 ， 则 用 0 
而 不 是 空格 填充 ; 


.可 选 的 点 ， 用 来 将 域 宽 与 下 一 个 数字 字符 串 分 隔 开 ; 


d 


可 选 的 数字 字符 串 ， 指 定 精度 ， 即 e 和 ff 转换 方式 下 小 数 点 后 显示 的 数字 位 数 ， 或 

字符 串 的 最 大 打印 字符 数 ; 

域 宽 或 精度 可 用 一 个 * 而 不 是 数字 字符 串 指定 。 在 此 情况 下 ， 用 一 个 整 型 额外 实 参 

提供 域 宽 或 精度 值 ; 

可 选 的 字符 h， 指 出 接 下 来 的 d、i、o、u、Xx 或 X 对 应 一 个 ( 带 符号 或 无 符号 的 ) 

短 整 型 实 参 。 

可 选 的 一 对 字符 hh， 指 出 接 下 来 的 d、i、o、u、Xx 或 X 实 参 被 当 作 一 个 ( 带 符号 或 

无 符号 的 ) char 实 参 ; 

可 选 的 字符 1， 指 出 接 下 来 的 d、i、o、u、x 或 X 对 应 一 个 〈 带 符号 或 无 符号 的 ) 长 

整 型 实 参 ; 

可 选 的 一 对 字符 1 四， 指出 接 下 来 的 d、i、o、u、x 或 X 对 应 一 个 〈 带 符号 或 无 符号 的 ) 

长 长 整 型 实 参 ; 

可 选 的 字符 L， 指 出 接 下 来 的 a、A、e、E、f、F、g 或 G 对 应 一 个 长 双 精 度 实 参 ; 

指出 接 下 来 的 d、i、o、u、x 或 X 对 应 一 个 intmax_t 或 uintmax_t 实 参 ; 

指出 接 下 来 的 d、i、o、u、x 或 X 对 应 一 个 size_t 实 参 ; 

指出 接 下 来 的 d、i、o、u、x 或 X 对 应 一 个 ptrdiff_t 实 参 ; 

指出 打印 一 个 %; 不 使 用 任何 实 参 ; 

一 个 字符 ， 指 出 要 应 用 的 转换 类 型 。 转 换 字符 及 其 含义 如 下 : 

整数 实 参 转换 为 十 进 制 记 数 法 ; 

整数 实 参 转换 为 十 进 制 记 数 法 ; 

整数 实 参 转换 为 八进制 记 数 法 ; 

整数 实 参 转换 为 十 六 进 制 记 数 法 ; 

整数 实 参 转换 为 十 六 进 制 记 数 法 ; 

float 和 double 实 参 转换 为 [-Jqdd.dd4 风格 的 十 进 制 记 数 法 。 小 数 点 后 4 的 个 数 

等 于 为 实 参 指定 的 精度 。 如 需要 ， 进 行 四 舍 五 和 人。 如 果 未 指定 精度 ， 打 印 六 位 数 

字 ; 如 果 显 式 指 定 了 精度 为 0 且 未 指定 #， 则 不 打印 小 数 点 ; 

F 类似 %f， 但 使 用 大 写字 母 打 印 INF 、INFINITY 和 NAN; 

e _ float 和 double 实 参 转换 为 科学 记 数 法 风格 的 十 进 制 表示 ， 即 /-]qd.dqde+d4 或 
[-]Jqd.ddde-ddq， 其 中 小 数 点 之 前 有 一 位 数字 ， 小 数 点 之 后 的 数字 位 数 与 实 参 的 精 
度 说 明 相等 。 如 需要 ， 进 行 四 舍 五 人 。 如 果 未 指定 精度 ， 打 印 六 位 数字 ; 如 果 显 
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式 指定 了 精度 为 0 且 示 指定 #， 则 不 打印 小 数 点 ; 
类 似 e, 但 用 大 写 的 E 表示 指数 ; 
g float 和 double 实 参 按 风格 d、 风 格 f 或 风格 e 打印 ， 选 择 占 用 最 小 空间 、 表 达 
最 大 精度 的 风格 ; 
类 似 g， 但 用 大 写 的 E 表示 指数 ; 
double 实 参 按 十 六 进 制 格式 /-]J0xh.hhhp+d 或 [-]0xh.hhhp-d; 
类 似 %a, 但 用 X 和 PP 代替 x 和 p; 
打印 字符 。 忽 略 空 字 符 ; 
接受 一 个 字符 串 (字符 指针 ) 实 参 ， 打 印字 符 串 中 的 字符 直至 遇 到 空 字 符 或 已 打 
印 了 精度 所 指定 的 字符 数 ; 但 是 ， 如 果 精 度 为 0 或 未 指定 精度 ， 打 印 空 字 符 前 的 
所 有 字符 ; 

p 接受 一 个 指针 实 参 。 打 印 的 形式 依赖 于 具体 C++ 实现 ; 

uU 无 符号 整数 实 参 转换 为 十 进 制 记 数 法 ; 

n 将 调用 printf()、fprintf() 或 sprintf() 已 打印 的 字符 数 写 入 int 指针 实 参 指向 的 int 

对 象 ; 
在 所 有 情况 下 ， 未 指定 域 宽 或 较 小 的 域 宽 都 不 会 导致 域 截断 ; 只 有 当 指 定 域 宽 大 于 实际 

宽度 时 才 进 行 填充 。 
下 面 是 一 个 更 精巧 的 例子 : 


char: line_format = "#line %d \"%s\"\n"; 
int line = 13; 
char* file_name = "C++/main.c"; 


m 


态 三 尖 前 秦 


printf("int a;\n"); 
printf(line_format,line,file_name); 


它 输 入 如 下 内 容 : 

int a; 

#line 13 "C++/main.c” 
printf() 不 进行 类 型 检查 ， 从 这 个 角度 讲 它 是 不 安全 的 。 例 如 ， 下 面 展 示 了 一 种 广为人知 的 
方法 ， 能 得 到 不 可 预测 的 输出 、 段 错误 甚至 更 糟 的 结果 : 


char x = "q'; 
printf("bad input char: %s",x); 省 %s 应 该 是 %c 


但 printf() 函数 的 确 以 C 程序 员 所 熟悉 的 形式 提供 了 极 大 的 灵活 性 。 

以 C++ 的 标准 ，C 并 未 提供 用 户 自 定义 类 型 机 制 ， 因 此 不 存在 为 complex 、vector 或 
string 这 样 的 用 户 自 定 义 类 型 定义 输出 格式 的 方法 。strftime() 的 格式 化 输出 ( 见 43.6 节 ) 可 
能 让 你 认为 这 可 通过 定义 一 组 新 的 格式 说 明 符 来 实现 ， 但 这 其 实 是 一 种 曲解 。 

C 标 准 输出 stdout 对 应 cout。C 标 准 输入 stdin 对 应 cin。C 标准 错误 输出 stderr 对 
应 cerr。C 标准 IO 和 C++ IO 流 的 这 种 对 应 关系 如 此 之 近 ， 以 至 于 C 风格 IO 和 IO 流 
可 共享 缓冲 。 例 如 ， 我 们 可 以 混合 使 用 cout 和 stdout 操作 生成 单一 输出 流 (在 C 和 C++ 
混合 代码 中 并 不 罕见 )。 但 这 种 灵活 性 也 带 来 了 额外 代价 ， 为 了 获得 最 佳 性 能 ， 不 要 混合 
stdio 和 iostream 操作 用 于 单一 流 。 为 了 确保 这 一 点 ， 可 在 第 一 次 IO 操作 之 前 调用 ios_ 
base::sync_with_stdio(false) ( 见 38.4.4 节 )。 

stdio 库 提供 了 一 个 scanf() 函数 ， 这 是 一 个 输入 操作 ， 风 格 上 模仿 了 printf()。 例 如 : 
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int x; 
char s[buf_size]; 
int i = scanf("the value of x is "%d' and the value of s is '%s'\n",&x,s); 


在 本 例 中 ，scanf() 尝试 读 取 一 个 整数 存 人 x， 接着 读 取 一 个 非 空 白字 符 的 序列 存 人 s。 一 个 
非 格式 字符 指出 在 输入 中 必须 包含 此 字符 。 例 如 ， 输 入 下 面 的 内 容 : 


the value of x is "123" and the value of s is "string \n” 


程序 会 读 取 123 存 人 x， 接 着 读 取 一 个 字符 串 并 尾随 一 个 0 存 人 s。 如 果 scanf() 调用 成 功 ， 
则 返回 值 (上 例 中 的 i) 表示 被 成 功 赋值 的 实 参 指针 数 (在 上 例 中 希望 是 2); 否则， 返回 值 
为 EOF。 这 种 指定 输入 的 方式 很 容易 出 错 ( 例 如 ， 如 果 忘 记 了 在 字符 串 之 后 输入 那个 空格 ， 
将 会 发 生 什么 )。scanf() 的 所 有 参数 都 必须 是 指针 ， 强 烈 建议 不 要 使 用 scanf()。 

如 果 必 须 使 用 stdio， 该 如 何 进 行 输入 呢 ? 一 个 常见 的 回答 是 “使 用 标准 库 消 数 
gets() ”: 

儿 非 常 危险 的 代码 : 

char s[buf_size]; 

char* p = gets(s); 外 读 取 一 行 存 入 s 
调用 p=gets(s) 读 取 字 符 存 人 s， 直 至 遇 到 换行 或 文件 尾 ， 在 最 后 一 个 字符 之 后 ， 还 会 向 S 
写 和 人 一 个 \0'。 如 果 遇 到 文件 尾 或 发 生 一 个 错误 ，p 被 设置 为 nullptr ; 否则 它 被 设置 为 s。 
千 万 不 要 使 用 gets(s) 或 大 致 等 价 的 scanf("%s"s) ! 多 少年 来 ， 它 们 都 是 病毒 编写 者 的 最 
爱 : 通过 提供 一 个 能 令 输入 缓冲 区 溢出 的 输入 (本 例 中 的 s)， 黑 客 就 能 破坏 程序 并 可 能 接管 
电脑 。 函 数 sprintf() 也 存在 类 似 的 缓冲 区 溢出 问题 。C11 版 本 的 C 标准 库 提供 了 一 整套 替代 
的 标准 库 输 入 函数 ， 它 们 接受 一 个 额外 实 参 来 抵御 溢出 ， 例 如 gets_s(p,n)。 类 似 iostream 
未 格式 化 输入 ， 这 些 函 数 其 实 是 将 确定 结束 条 件 ( 见 38.4.1.2 节 ; 如 ， 过 多 字符 、 终 止 符 或 
文件 尾 ) 的 问题 留 给 了 用 户 。 

stdio 库 也 提供 了 简单 且 有 用 的 字符 读 写 函数 : 


标准 输入 输出 字符 函数 
x=g etc(st) 从 输入 流 st 读 取 一 个 字符 ; x 为 字符 的 整数 值 ， 若 遇 到 文件 尾 或 错误 ，x 为 EOF 
x=putc(c,st) 将 字符 c 写 入 输出 流 st; x 为 写 入 的 字符 的 整数 值 ， 若 遇 到 错误 ，x 为 EOF 
x=g etchar() x=getc(stdin) 
x=putchar(c) x=putc(c, stdout) 
x=ungetc(c,st) 将 字符 c 退 回 输 入 流 st; x 为 c 的 整数 值 ， 若 遇 到 错误 ，x 为 EOF 





这 些 操 作 都 返回 一 个 int (而 不 是 一 个 char， 否 则 就 不 可 能 返回 EOF 了 )。 例 如 ， 下 面 是 一 
个 典型 的 C 风格 输入 循环 : 


int ch; /注意 : 不 是 “char ch;” 
while ((ch=getchar())!=EOF){ 庆 执行 一 些 操作 扩 } 


不 要 对 一 个 流连 续 执行 ungetc()， 那 样 做 的 结果 是 未 定义 且 不 可 移植 的 。 
标准 输入 输出 函数 还 有 很 多 ， 如 果 你 需要 了 解 更 多 ， 请 参考 一 本 好 的 C 语言 教材 (例如 
“K&R” )。 


43.4 C 风格 字符 串 
一 个 C 风格 字符 串 就 是 一 个 零 结 尾 的 char 数组 。 定 义 于 <cstring> (或 <string.h> ; 注 
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意 , 不 是 <string>) 和 <cstdLib> 中 的 一 组 函数 提供 了 对 这 种 字符 串 表示 方法 的 支持 。 这 些 
函数 操作 通过 char* 指针 (const char* 指针 用 于 只 读 内 存 ， 不 使 用 unsigned char* 指针 ) 
操作 C 风格 字符 捉 : 


C 风格 字符 串 操 作 
x=strlen(s) 统计 字符 数 (不 包括 结尾 0) 
p=strcpy(s,s2) 将 s2 拷贝 到 s; [s:stn) 和 [s2:s2+n) 不 能 重 释 ; p=s; 结尾 0 也 会 被 拷贝 
p=strcat(s,s2) 将 s2 拷贝 到 s 的 末尾 ; p=s; 结尾 0 也 会 被 拷贝 
x=stremp(s, s2) 字典 序 比较 : 若 s<s2， 则 x 为 负数 ; 若 s==s2， 则 x==0; 若 s>s2， 则 x 为 正 
p=strncpy(s,s2,n) strcpy 最 多 n 个 字符 ; 拷贝 结尾 0 可 能 失败 
p=strncat(s,s2,n) strcat 最 多 mn 个 字符 ; 拷贝 结尾 0 可 能 失败 
x=strncmp(s,s2,n) strcmp 最 多 n 个 字符 
p=strchr(s,c) p 指向 s 中 第 一 个 c 
p=strrchr(s,c) p 指向 s 中 最 后 一 个 c 
p=strstr(s,s2) p 指向 s 中 与 s2 相等 的 第 一 个 子 串 的 起 始 字符 
p=strpbrk(s,s2) p 指向 s 中 也 在 s2 出 现 的 第 一 个 字符 


注意 ， 在 C++ 中， 出 于 类 型 安全 考虑 ，strchr() 和 strstr() 都 有 两 个 版 本 (它们 不 能 像 对 应 
的 C 版 本 那样 将 const char* 转换 为 char*)。 参 见 36.3.2 节 、36.3.3 节 和 36.3.7 节 。 


C 风格 数值 转换 
p 指向 s 中 未 进行 转换 的 第 一 个 字符 ; 
b 为 一 个 基数 ， 在 [2:36) 间 ， 或 为 0 表示 使 用 C 源码 风格 数值 


x=atof(s) x 是 一 个 可 表示 为 s 的 double 
x=atoi(s) x 是 一 个 可 表示 为 s 的 int 

x=atol(s) x 是 一 个 可 表示 为 s 的 long 
x=atoll(s) x 是 一 个 可 表示 为 s 的 long long 
x=strtod(s,p) x 是 一 个 可 表示 为 s 的 double 
x=strtof(s,p) x 是 一 个 可 表示 为 s 的 float 
x=strtold(s,p) x 是 一 个 可 表示 为 s 的 long double 
x=strtol(s,p,b) x 是 一 个 可 表示 为 s 的 long 
x=strtoll(s,p,b) x 是 一 个 可 表示 为 s 的 long long 
x=strtoul(s,p,b) x 是 一 个 可 表示 为 s 的 unsigned long 
x=strtoull(s,p,b) x 是 一 个 可 表示 为 s 的 unsigned long long 


如 果 转 换 为 浮 点 数 时 结果 无 法 放 入 目标 类 型 ， 则 会 将 errno 设置 为 ERANGE ( 见 40.3 节 )。 
- 参见 36.3.5 节 。 
43.5 ”内存 


操纵 内 存 的 函数 通过 void* 指针 (const void* 用 于 只 读 内 存 ) 对 “ 裸 内 存 ”( 类 型 未 知 ) 
进行 操作 : 


336 入 四 部 分 标 准 庆 





C 风格 内 存 操作 
q=memcpy(p,p2,n) 从 p2 向 p 找 贝 n 个 字 节 (类似 strcpy); [p:p+n) 和 [p2:p2+n) 不 能 重 又 ; q=p 
q=memmove(p,p2,n) 从 p2 向 p 拷 贝 n 个 字 节 ; q=p 
x=memcmp(p,p2,n) 比较 p2 中 个 字 节 和 p 中 nn 个 对 应 字 节 : x<0 表示 <，x==0 表示 ==，x>0 表示 >， 


q=memchr(p,c,n) 在 [p:p+n) 中 查找 c (转换 为 一 个 unsigned char); 9q 指向 该 元 素 ; 若 未 找到 c 则 q=0 
q=memset(p,c,n) 将 c (转换 为 一 个 unsigned char) 拷贝 到 [p:p+n) 中 的 每 个 位 置 ; q=p 

p=calloc(n,s) p 指向 自由 存储 上 分 配 的 n*s 个 字 节 ， 全 部 初始 化 为 0; 若 分 配 失败 ，p=nullptr 
p=malloc(n) p 指向 自由 存储 上 分 配 的 mn 个 未 初始 化 字 节 ; 若 分 配 失败 ，p=nullptr 

q=realloc(p,n) q 指 向 自由 存储 上 分 配 的 n 个 字 节 ; p 必 须 是 malloc() 或 calloc() 返 回 的 指针 或 


nullptr ; 尽 可 能 重复 使 用 p 指向 的 空间 ， 如 不 能 ， 将 p 指向 的 区 域 中 的 所 有 字 节 拷贝 到 
新 区 域 ; 若 不 能 分 配 n 个 字 节 ，q=nullptr 
free(p) 释放 p 指向 的 内 存 ; p 必须 是 malloc() 、calloc() 或 realloc() 返回 的 指针 或 nullptr 


注意 ，malloc() 等 函数 并 不 调用 构造 函数 ，free() 也 不 会 调用 析 构 函数 。 不 要 对 具有 构造 函数 
和 析 构 函数 的 类 型 使 用 这 些 函数 。 而 且 ，memset() 也 不 应 该 用 于 具有 构造 函数 的 任何 类 型 。 


注意 ，realloc(p,n) 若 发 现 所 需 内 存量 超出 了 从 p 开始 的 区 域 大 小 ， 它 会 重新 分 配 〈 即 拷贝 ) 从 pp 
开始 保存 的 数据 ， 例 如 : 


int max = 1024; 
char* p = static_cast<char*>(malloc(max)); 
char* current_word = nullptr; 
bool in_word = false; 
int i=0; 
while (cin.get(&p[i]) { 
if (isletter(p[i])) { 
if (lin_word) 
current_word = p; 
in_word = true; 
》 
else 
in _word = false; 
if (++i==max) 
p = static_cast<char#*>(realloc(p,max*=2)); /分配 双 倍 空间 
Was 
} 


我 希望 你 能 指出 这 段 代 码 中 的 糟糕 错误 : 如 果 调 用 了 realloc()，current_word 可 能 (也 可 能 
不 ， 如 果 未 重新 分 配 的 话 ) 指向 p 的 当前 存储 区 域 之 外 的 位 置 。 

大 多 数 情况 下 使 用 vector ( 见 31.4.1 节 ) 比 realloc() 更 好 。 

mem* 函数 可 在 <cstring> 中 找到 ， 分 配 函 数 在 <cstdlib> 中 。 


43.6 “日 期 和 时 间 
在 <ctime> 中 ， 可 以 找到 一 些 日 期 和 时 间 相关 的 类 型 和 函数 : 


日 期 和 时 间 类 型 
clock t 用 于 保存 短 时 间 间 隔 (可 能 只 有 几 分 钟 ) 的 算术 类 型 
time_t 用 于 保存 长 时 间 间 隔 〈 可 能 是 几 个 世纪 ) 的 算术 类 型 


tm 一 个 struct， 用 于 保存 日 期 和 时 间 ( 自 1900 年 起 计算 ) 
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struct tm 定义 如 下 : 


struct tm { 
int tm_sec; /分 钟 内 第 几 秒 ，[0:61]; 60 和 61 表示 头 秒 
int tm_min; /小 时 内 第 几 分 钟 ，[0:59] 
int tm_hour; /一 天 内 第 几 个 小 时 ，[0:23] 
int tm_mday; // 月 内 第 几 天 ，[1:31] 
int tm_mon; /1 年 内 第 几 个 月 ，[0:11]，0 表示 一 月 (注意 : 取 值 范围 不 是 [1:12]) 
int tm_year; 省 自 1900 年 起 的 第 几 年 ; 0 表示 1900 年 ，115 表示 2015 年 
int tm_wday; /从 星期 天 记 起 的 天 数 ，[0:6]; 0 表示 星期 天 
int tm_yday; /从 1 月 1 日 记 起 的 天 数 ，[0:365]; 0 表示 1 月 1 日 
int tm_isdst; ”/W/ 夏 令 时 的 小 时 值 
}; 


函数 clock() 提供 了 对 系统 时 钟 的 支持 ， 其 返回 类 型 clock_t 的 含义 可 由 其 他 几 个 函数 解释 : 


日 期 和 时 间 函 数 

t=clock() t 为 程序 开始 运行 到 现在 所 经 历 的 时 钟 滴答 数 ; t 是 clock_t 类 型 

t=time(pt) t 为 当前 日 历时 间 ; pt 是 一 个 time_t* 或 nullptr; t 是 一 个 clock_t; 若 ptl=nullptr， 
则 *pt=t 

d=difftime(t2,t1) d 是 一 个 double， 表 示 t2-t1 的 秒 数 

ptm=localtime(pt) 若 pt==nullptr， 则 ptm=nullptr; 否则 ptm 指向 *pt 对 应 的 time_t 本 地 时 间 

ptm=gmtime(pt) 若 pt==nullptr， 则 ptm=nullptr ; 否则 ptm 指向 *pt 对 应 的 格林 威 治标 准时 间 
(Greenwich Mean Time, GTM) tm 

t=mktime(ptm) *ptm 对 应 的 time_t 或 time_t(-1) 

p=asctime(ptm) p 是 *ptm 的 C 风格 字符 串 表示 

p=ctime(t) p=asctime(localtime(t)) 


n=strftime(p,max,fmt,ptm) “将 *ptm 拷贝 到 [p:p+n+1)， 格式 由 格式 字符 串 fmt 控制 ; 超出 [p:pt+max) 的 字 
符 串 被 丢弃 掉 ; 若 发 生 错误 ，n=0; p[n]=0 


下 面 是 asctime() 返回 结果 的 例子 : 
"Sun Sep 16 01:03:52 1973\n" 


下 面 是 一 个 用 clock() 进行 函数 计时 的 例子 : 


int main(int argc, char* argv[]) 
int n = atoi(argv[1]); 


clock_tt1 = clock(); 


if (t1 == clock_t(-1)) { 中 clock t(-1) 表示 “clock() 不 能 正常 工作 ” 
cerr << "sorry, no clock\n"; 
exit(1); 

} 


for (int i = 0; i<n; i++) 
do_something(); 中 对 循环 计时 
clock_t t2 = clock(); 
if (t2 == clock_t(-1)) { 
cerr << "sorry, clock overflow\n"; 
exit(2); 


cout << "do_something() "<<n << "times took ” 
<< double(t2-t1)/CLOCKS_PER_ SEC <<" seconds" 
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<<" (measurement granularity: " << CLOCKS PER SEC 
<<" ofa second)\n"; 


} 
在 除法 运算 之 前 进行 显 式 类 型 转换 double(t2-t1) 是 必要 的 ， 因 为 clock_t 可 能 是 整数 。 对 
clock() 的 返回 值 t1 和 t2 而 言 ， double(t2-t1)/CLOCKS_PER_SEC 是 系统 对 两 次 调用 间隔 
秒 数 的 最 佳 近似 。 

如 对 比 <ctime> 和 <chrono> 中 提供 的 特性 ， 请 参阅 35.2 节 。 

如 果 处 理 器 不 支持 clock() 或 时 间 间 隔 过 长 难以 测量 ， 则 clock() 返回 clock_t(-1)。 

靖 数 strftime() 使 用 一 个 printf() 格式 化 字符 串 控制 tm 的 输出 。 例 如 : 


void aimost_C() 


const int max = 80; 
char str[max]; 
time_t t= time(nuliptr); 
tm* pt = localtime(&t); 
strftime(str,max,"%D, %H:%M (%l:% MW%p)\n", pt); 
printf(str); 

} 

输出 可 能 像 下 面 这 样 : 
06/28/12, 15:38 (03:38PM) 


strftime() 的 格式 控制 字符 几乎 构成 了 一 个 小 型 编程 语言 : 


日 期 和 时 间 格 式 化 
%a 星期 名 缩写 
%A 完整 星期 名 
%b 月 份 名 缩写 
%B 完整 月 份 名 
%c 日期 和 时 间 表 示 
%C 年 份 除 以 100， 截 取 为 [00:99] 间 的 十 进 制 整数 
%d 月 内 第 几 天 ，[01:31] 间 的 十 进 制 整数 
%D 等 价 于 %m%d%y 
%e 月 内 第 几 天 ，[01:31] 间 的 十 进 制 整数 ， 如 果 是 一 位 数字 ， 前 面 补 一 个 空格 
%F 等 价 于 %Y-%m-%d; ISO 8601 日 期 格式 
%g 按 周记 的 年 份 十 进 制 值 的 后 两 位 数字 ，[00:99] 
%G 按 周 记 的 年 份 十 进 制 值 ( 如 2012 ) 
%h 等 价 于 %b 
%H (24 小 时 制 ) 小 时 值 十 进 制 表示 ，[00:23] 
%1 (12 小 时 制 ) 小 时 值 十 进 制 表 示 ，[01:12] 
%j 年 内 第 几 天 的 十 进 制 值 ，[001:366] 
%m 月 份 十 进 制 值 ，[01:12] 
%M 分 钟 十 进 制 值 ，[00:59] 
%n 换行 符 
%p 二 小 时 制 上 午 /下 午 的 区 域 表示 
%r 上 二 小 时 制 时 间 
%R 等 价 于 %H:%M 
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( 续 ) 
日 期 和 时 间 格 式 化 
%S 秒 十 进 制 值 ，[00:60] 
%t 水 平 制 表 符 
%T 等 价 于 %H:%M:%S; ISO 8601 时 间 格 式 
%u ISO 8601 星期 十 进 制 值 ，[1:7]; 星期 一 为 1 
%U 年 内 第 几 个 星期 (第 一 个 星期 天 为 第 1 周 的 第 一 天 ) 的 十 进 制 表示 ，[00:53] 
%V ISO 8601 星期 值 的 十 进 制 表示 ，[01:53] 
%w 星期 几 的 十 进 制 表示 ，[0:6]; 星期 天 为 0 
%W 年 内 第 几 个 星期 (第 一 个 星期 一 为 第 1 周 的 第 一 天 ) 的 十 进 制 表示 ，[00:53] 
x 日 期 的 恰当 区 域 表示 
%X 时 间 的 恰当 区 域 表 示 
%y 年 份 十 进 制 表示 的 后 两 位 数字 ，[00:99] 
%Y 年 份 十 进 制 表 示 (如 2012 ) 


%z 与 世界 标准 时 间 (UTC) 的 偏 黎 ， 用 ISO 8601 格式 表示 ， 如 -0430 (落后 UTC， 也 就 是 格林 威 治 时 间 
4.5 小 时 ); 如 不 能 确定 时 区 则 没有 任何 结果 


%Z 时 区 名 区 域 表示 或 缩写 ; 如 不 能 确定 时 区 则 没有 任何 结果 
%% 字符 % 


























这 里 所 说 的 区 域 设置 是 程序 的 全 局 区 域 设 置 。 
某 些 转换 说 明 符 可 被 修饰 符 E 或 O 修改 ， 表 示 可 选 的 与 C++ 实现 和 区 域 设置 相关 的 格 
式 化 。 例 如 : 











日 期 和 时 间 修 饰 符 例 子 
%Ec 可 选 的 日 期 和 时 间 的 区 域 表示 
%EC 可 选 的 区 域 表示 中 基准 年 (时代) 的 名 字 
%OH (24 小 时 制 ) 小 时 值 ， 用 可 选 的 区 域 数值 符号 表示 
%Oy 年 份 值 的 后 两 位 数字 ， 用 可 选 的 区 域 数值 符号 表示 


put_time facet ( 见 39.4.4.1 节 ) 用 到 了 strftime()。 
C++ 风格 时 间 特 性 见 35.2 节 。 


43.7 ”杂项 
<cstdlib> 中 还 有 如 下 特性 : 


<stdlib.h> 中 的 杂项 函数 





abort() “异常 ”结束 程序 

exit(n) 结束 程序 ， 返 回 n; n==0 表示 程序 成 功 结束 

system(s) 将 字符 串 作为 一 条 命令 执行 (依赖 于 系统 ) 

qsort(b,n,s,cmp) 排序 从 b 开始 的 n 个 元 素 的 数组 ， 元 素 大 小 为 s, 使 用 比较 函数 cmp 
bsearch(k,b,n,s,cmp) 在 b 开始 的 nm 个 元 素 的 有 序数 组 中 搜索 k， 元 素 大 小 为 s， 使 用 比较 函数 cmp 
d=rand() d 是 [0:RAND_MAXI] 间 的 一 个 伪 随 机 数 


srand(d) 将 d 作为 种 子 开 始 一 个 伪 随 机 数 序列 
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qsort() 和 bsearch() 使 用 的 比较 函数 (cmp) 必须 具有 如 下 类 型 ; 


int (*cmp)(const void* p, const void* q); 


即 ， 排 序 晒 数 不 了 解 任 何 类 型 信息 ， 只 是 简单 地 将 其 数组 实 参 视 为 字 节 序 列 。 排 序 函 数 按 如 
下 规则 返回 一 个 整 型 值 ; 

e 若 认 为 *p 小 于 *q， 则 返回 负数 ; 

e 若 认 为 *p 等 于 *q， 则 返回 零 ; 

。 若 认为 *p 大 于 *q， 则 返回 正 数 。 
这 与 使 用 传统 的 < 的 sort() 不 同 。 

注意 ，exit() 和 abort() 并 不 调用 析 构 函数 。 如 果 你 希望 调用 已 构造 对 象 的 析 构 函数 ， 可 
抛 出 一 个 异常 ( 见 13.5.1 节 )。 | 

类 似 地 ，<csetimp> 中 的 longjmp() 是 一 种 非 局 部 的 goto， 它 不 断 解 开 调 用 栈 ， 直 至 找 
到 与 setjmp() 匹配 的 结果 。 它 也 不 调用 析 构 函数 。 如 果 从 程序 同一 位 置 的 throw 语句 调用 
了 析 构 函数 ，longjmp() 的 行为 是 未 定义 的 。 绝 不 要 在 C++ 程序 中 使 用 setimp()。 

更 多 的 C 标准 库 函 数 请 参考 [Kernighan,1988] 或 其 他 一 些 有 良好 声誉 的 C 语言 参考 书籍 。 

在 <cstdint> 中 ， 我 们 可 以 找到 int_fast16_t 和 其 他 标准 整数 别名 : 


整数 类 型 别名 

N 可 能 是 8、16、32 或 64 
int N_t N 位 整数 类 型 ， 如 int_8_t 
uint N_t N 位 无 符号 整数 类 型 ， 如 uint_16_t 
int_leastN_t 至 少 N 位 的 整数 类 型 ， 如 int_least16 t 
uint_leastN ft 至 少 N 位 的 无 符号 整数 类 型 ， 如 uint_least32_t 
int_fastN_t 至 少 NN 位 的 整数 类 型 ， 如 int_fast32_t 
uint_ fastN_t 至 少 N 位 的 无 符号 整数 类 型 ， 如 int_fast64 ft 


<cstdint> 中 还 提供 了 最 大 带 符号 和 无 符号 整数 类 型 的 别名 。 例 如 : 


typedef long long intmax_t; 川 最 大 带 符号 整数 类 型 
typedef unsigned long long uintmax_t; 儿 最 大 无 符号 整数 类 型 


43.8 建议 


[ 1] 如 果 担 心 资源 泄漏 ， 使 用 fstream 而 不 是 fopen()/fclose(); 43.2 节 。 

[2 ] 出 于 类 型 安全 和 扩展 性 的 考虑 ， 优 先 选择 <iostream> 而 不 是 <stdlib>; 43.3 节 。 
[3 ] 绝 不 要 使 用 gets() 或 scanf("%s"s); 43.3 节 。 

[4] 出 于 资源 管理 易 用 性 和 简单 性 考虑 ， 使 用 <string> 而 不 是 <cstring>; 43.4 节 。 
[5] 只 对 裸 内 存 使 用 C 内 存 管理 例 程 ， 如 memcpy(); 43.5 节 。 

[6] 优先 选择 vector 而 不 是 malloc() 和 realloc(); 43.5 节 。 

[7] C 标 准 库 不 了 解构 造 函 数 和 析 构 函数 ， 对 此 要 小 心 ; 43.5 节 。 

[8 ] 优先 选择 <chrono> 而 不 是 <ctime> 进行 计时 ; 43.6 节 。 

[9] 考虑 到 灵活 性 、 易 用 性 和 性 能 ,优先 选择 sort() 而 不 是 qsort(); 43.7 节 。 
[10] 不 要 使 用 exit()， 应 选择 抛 出 异常 ; 43.7 节 。 

[11 ] 不 要 使 用 longjmp()， 应 选择 抛 出 异常 ;43.7 节 。 
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e 引言 
e C++11 扩展 
语言 特性 ; 标准 库 组 件 ; 废弃 特性 ; 应 对 旧版 本 C++ 实现 
e C/C++ 兼容 性 
C 和 C++ 是 兄弟 ;“ 静 默 ”差异 ; 不 兼容 C++ 的 C 代码 ; 不 兼容 C 的 C++ 代码 
e 建议 


44.1 引言 


本 章 介 绍 标准 C++ (ISO/IEC 14882-2011 定义 ) 与 较 早 版 本 (如 ISO/IEC 14882-1988 ) 
间 的 差异 ， 以 及 与 标准 C(ISO/IEC 9899-2011 定义 ) 和 较 早 C 版 本 (如 经 典 C) 之 间 的 差异 。 
本 章 的 目的 是 : 

e 给 出 C++11 新 特性 的 简明 列表 ; 

e 介绍 会 给 程序 员 带 来 难题 的 差异 ; 

e 指出 解决 问题 的 方法 。 

大 多 数 兼 容 性 问题 都 发 生 在 人 们 尝试 将 C 程序 升级 为 C++ 程序 时 、 尝 试 将 旧版 本 C++ 
程序 移植 到 新 版 本 C++ 时 (如 C++98 或 CH+11 )， 以 及 尝试 用 旧版 本 编译 器 编译 使 用 新 特性 
的 C++ 程序 时 。 本 章 的 目的 不 是 穷 举 所 有 可 能 的 兼容 性 问题 ， 而 是 列 出 最 常见 的 问题 并 介 
绍 其 标准 解决 方案 。 

当 考 察 兼容 性 问题 时 ， 要 考虑 的 一 个 关键 问题 是 程序 开发 要 用 到 哪些 C++ 实现 。 为 了 
学 习 C++， 使 用 最 完整 旦 最 有 用 的 实现 是 很 有 意义 的 。 而 为 了 交付 一 个 产品 ， 更 稳妥 的 策略 
可 能 是 令 产品 能 在 尽量 多 的 系统 上 运行 。 以 往 ， 这 曾 是 不 使 用 C++ 新 特性 的 一 个 原因 (更 多 
的 时 候 只 是 一 个 借口 )。 但 是 ，C++ 实现 正在 逐渐 合流 ， 跨 平台 移植 已 不 再 需要 特别 小 心地 
考虑 兼容 性 问题 了 。 


44.2 C++11 扩展 

这 里 首先 列 出 C++11 标准 增加 的 语言 特性 和 标准 库 组 件 。 接 下 来 将 讨论 应 对 旧版 本 
(特别 是 C++98 ) 的 方法 。 
44.2.1 语言 特性 


研究 语言 特性 列表 着 实 让 人 眼花 综 乱 。 但 要 记 住 ,语言 特性 并 不 是 孤立 使 用 的 。 特 别 
是 ， 大 多 数 C++11 新 特性 如 果 脱 离 了 其 他 特性 构成 的 框架 就 毫 无 意义 。 下 面 特性 列表 的 顺 
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序 大 致 就 是 这 些 特性 在 本 书 中 第 一 次 出 现 的 顺序 : 


[1] 
[ 受 j 
[3] 
[4] 
[3] 
[6] 
[7] 
[8] 
[9] 
[10] 
[11] 
[ 12] 
[ 13] 
[14] 
L 15] 
[16] 
[17] 
[18] 
[19] 
[ 20] 
[21 ] 
[22 ] 
[23 ] 
[24 ] 





[25 ] 
[26 ] 
[27j 


[28 ] 
[29 
[30 ] 
[31 ] 
[ 32] 
[33 ] 
[34 ] 
[35 ] 
[36 ] 





使 用 人 列表 进行 一 致 且 通用 的 初始 化 (2.2.2 节 ，6.3.5 节 ); 
从 初始 化 器 进行 类 型 推断 : auto (2.2.2 节 ，6.3.6.1 节 ); 
避免 奉化 转换 (2.2.2 节 ，6.3.5 节 ); 
推广 的 且 有 保证 的 常量 表达 式 : constexpr (2.2.3 节 ，10.4 节 ，12.1.6 节 ); 
范围 for 语句 (2.2.5 节 ，9.5.1 节 ); 
空 指针 关键 字 : nullptr ( 2.2.5 节 ，7.2.2 节 ); 
限 域 且 强 类 型 的 枚 举 : enum class (2.3.3 节 ，8.4.1 节 ); 
编译 时 断言 : static_assert ( 2.4.3.3 节 ，24.4 节 ); 
个 列表 到 std::initializer_list 的 语言 映射 (3.2.1.3 节 ，17.3.4 节 ); 
右 值 引用 (允许 移动 语义 ; 3.3.2 节 ，7.7.2 节 广 
以 >> 结束 的 般 套 模板 参数 (两 个 > 间 无 空格 ，3.4.1 节 ); 
1ambda (3.4.3 节 ，11.4 节 ); 
可 变 参数 模板 ( 3.4.4 节 ，28.6 节 ); 
类 型 和 模板 别名 ( 3.4.5 节 ，6.5 节 ，23.6 节 ); 
Unicode 字符 ( 6.2.3.2 节 ，7.3.2.2 节 ); 
long long 整数 类 型 ( 6.2.4 节 ); 
对 齐 控制 : alignas 和 alignof ( 6.2.9 节 ); 
在 声明 中 将 表达 式 的 类 型 用 作 类 型 的 能 力 : decltype (6.3.6.1 节 ); 
裸 字符 串 字 面值 常量 (7.3.2.1 节 ); 
推广 的 POD ( 8.2.6 节 ); 
推广 的 union (8.3.1 节 ); 
局 部 类 作为 模板 实 参 (11.4.2 节 ，25.2.1 节 ); 
尾 置 返回 类 型 语法 (12.1.4 节 ); 
属性 语法 和 两 种 标准 属性 : [[carries_dependency]] (41.3 节 ) 和 [[noreturn]] 
( I 了 21.7 节 为 
阻止 异常 传播 : noexcept 说 明 符 (13.5.1.1 节 ); 
检测 表达 式 中 抛 出 异常 的 可 能 性 : noexcept 运算 符 ( 13.5.1.1 节 ); 
C99 特性 : 扩展 的 整数 类 型 ( 即 可 选 的 长 整数 类 型 的 规则 ; 6.2.4 节 ); 窄 字符 串 
和 宽 字 符 串 的 链接 ;，_func STDC_HOSTED_ (12.6.2 节 ); _Pragma(X) 
( 12.6.3 节 ); 可 变 参 数 宏 及 空 宏 参数 ( 12.6 节 ); 
inline 名 字 空 间 ( 14.4.6 节 ); 
委托 构造 函数 (17.4.3 节 ); 
类 内 成 员 初始 化 器 ( 17.4.4 节 ); 
默认 控制 : default ( 17.6 节 ) 和 delete (17.6.4 节 ); 
显 式 转换 运算 符 ( 18.4.2 节 ); 
用 户 自 定义 字面 值 常量 ( 19.2.6 节 ); 
template 实例 化 更 为 显 式 的 控制 : extern template ( 26.2.2 市 ); 
函数 模板 的 默认 模板 实 参 〈25.2.5.1 节 ) 
继承 构造 函数 ( 20.3.5.1 节 ); 


[37 ] 
[38 ] 
[39 ] 
[ 40 ] 
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覆盖 控制 : override 和 final ( 20.3.4 节 ); 

更 简单 、 更 通用 的 SFINAE 规则 ( 23.5.3.2 节 ); 
内 存 模型 ( 41.2 节 ); 

线程 局 部 存储 : thread local ( 42.2.8 节 )。 


我 并 未 尝试 列 出 C++98 到 C++11 的 每 个 细小 变化 。 从 历史 视角 对 这 些 特性 的 讨论 请 见 1.4 节 。 
44.2.2 ”标准 库 组 件 


C++11 对 标准 库 的 扩充 有 两 种 形式 : 新 组 件 (如 正则 表达 式 匹 配 库 ) 和 C++98 组 件 的 
改进 (如 容器 的 移动 构造 函数 )。 


[1] 
[人 2] 
[3 
[ 4] 


[5] 
[6] 











Wi 


容器 的 initializer_list 构造 函数 (3.2.1.3 节 ，17.3.4 节 ，31.3.2 节 ); 
容器 的 移动 语义 (3.3.1 节 ，17.5.2 节 ，31.3.2 节 ); 
单 向 链表 : forward_list ( 4.4.5 节 ，31.4.2 节 ); 
哈 希 容器 : unordered_map、unordered_multimap、unordered_set 和 unordered_ 
multiset ( 4.4.5 节 ，31.4.3 节 ); 
资源 管理 指针 : unique_ptr、shared_ptr 和 weak_ptr (5.2.1 节 ，34.3 节 ); 
并 发 的 支持 : thread ( 5.3.1 节 , 42.2 节 )、 互 斥 量 (5.3.4 节 , 42.3.1 节 )、 锁 (5.3.4 
节 ，42.3.2 节 ) 和 条 件 变量 (5.3.4.1 节 ，42.3.4 节 ) 
高 层 并 发 支持 : packaged _ thread future .promise 和 async() (5.3.5 节 ,42.4 节 ); 
tuple ( 5.4.3 节 ，28.5 节 ，34.2.4.2 节 ); 
正则 表达 式 : regex (5.5 节 ,第 37 章 ); 
随机 数 : uniform_int_distribution .normal_distribution .random_engine 等 ( 5.6.3 
节 ，40.7 节 ); 
整数 类 型 和 名， 如 int16 t、uint32 ft 和 int_ fast64 t (6.2.8 节 ，43.7 节 ); 
固定 大 小 连续 存储 序列 容器 : array ( 8.2.4 节 ，34.2.1 节 ); 
拷贝 和 重 抛 出 异常 (30.4.1.2 节 ); 
使 用 错误 码 报告 错误 : system_error ( 30.4.3 节 ); 
容器 的 emplace() 操作 (31.3.6 节 ); 
广泛 使 用 constexpr 函数 ; 
系统 使 用 noexcept 函数 ; 
改进 的 函数 适配器 : function 和 bind() (33.5 节 ); 
string 到 数值 的 转换 ( 36.3.5 节 ); 
限 域 分 配器 (34.4.4 节 ); 
类 型 萃取 ,如 is_integral 和 is_base_of (35.4 节 ); 
时 间 工 具 : duration 和 time_point ( 35.2 节 ); 
编译 时 有 理 数 算术 运算 : ratio (35.3 节 ); 
放弃 进程 : quick_exit ( 15.4.3 节 ); 
更 多 算法 ， 如 move()、copy _if() 和 is_sorted() (第 32 章 ); 
垃圾 收集 ABI ( 34.5 节 ); 
低层 并 发 支持 : atomic ( 41.3 节 )。 


标准 库 相 关 的 更 多 内 容 可 人 参考: 
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e 第 4 章 、 第 5 章 和 第 四 部 分 ; 

e 实现 技术 示例 : vector ( 13.6 节 )、string ( 19.3 节 ) 和 tuple (28.5 节 ); 
e 逐渐 增多 的 专门 的 C++11 标准 库 文献 ， 如 [Williams, 2012]; 

e 一 个 简单 的 历史 视角 的 介绍 请 见 1.4 节 。 


44.2.3” 弃 用 特性 


通过 奔 用 一 个 特性 ，C++ 标准 委员 会 表达 了 希望 该 特性 不 再 被 使 用 的 愿望 (iso.D)。 
是 ， 如 果 一 个 特性 被 广泛 使 用 ， 即 使 它 多 么 无 用 或 危险 ， 委 员 会 也 没有 权利 立即 删除 它 。 
此 ， 弃 用 只 是 避免 使 用 一 个 特性 的 强烈 提示 ， 这 种 特性 将 来 可 能 消失 。 ea 
代码 ， 编 译 器 可 能 发 出 警告 。 

e 对 带 析 构 函 数 的 类 不 再 生成 拷贝 构造 函数 和 拷贝 赋值 操作 。 

e 不 再 允许 将 字符 串 字 面值 常量 赋予 一 个 char* ( 见 7.3.2 节 )。 

e C++98 异常 说 明 被 弃 用 : 

void f() throw(X,Y); 1/ C++98 特性 ， 现 在 被 弃 用 


支持 异常 说 明 的 特性 ，unexcepted_handler、set_unexpected()、get_unexpected() 
和 unexpected() 也 被 弃 用 了 。 作 为 替代 ， 使 用 noexcept ( 见 13.5.1.1 节 )。 

某 些 C++ 标准 库 函 数 对 象 及 相关 函数 被 弃 用 : unary_function、binary_function、 
pointer_ to_unary_function、pointer_ to_binary_function、ptr_ fun()、mem_fun_t、 
mem_fun1_t、mem_fun_ref t、mem_fun_ref1 ft、mem_fun()、const mem_fun_t、 
const mem_fun1_t、const mem _ fun_ref t、const _mem fun_ref1_t、binder1st、 
bind1st()、binder2nd 和 bind2nd()。 作 为 替代 ， 使 用 function 和 bind() ( 见 33.5 节 )。 

e auto_ptr 被 弃 用 。 作 为 替代 ,使 用 unique_ptr ( 见 5.2.1 节 和 34.3.1 节 )。 

此 外 ， 委 员 会 还 删除 了 基本 无 人 使 用 的 export 特性 ， 因 为 它 过 于 复杂 ， 主 要 的 C++ 实 
现 中 均 未 支持 。 

当 引 入 命名 类 型 转换 ( 见 11.5.2 节 ) 后 , C 风格 类 型 转换 就 应 该 被 弃 用 了 。 程 序 员 
应 认真 考虑 在 自己 et ed C 风格 类 型 转换 。 如 需 显 式 类 型 转换 ，static_cast、 
reinterpret_cast、const_cast 或 它们 的 组 合 能 实现 C 风格 类 型 转换 的 所 有 功能 。 我 们 应 该 
优先 选择 命名 类 型 转换 ， 因 为 它们 是 显 式 的 ， 在 程序 中 也 更 为 明显 可 见 


44.2.4 应 对 旧版 本 C++ 实现 


从 1983 年 开始 C++ 就 已 成 为 一 种 常用 的 编程 语言 ( 见 1.4 节 )。 从 那 时 开始 至 今 ， 已 经 
发 布 了 多 个 C++ 标准， 出现 了 大 量 独 立 开 发 的 C++ 实现 。 标 准 委员 会 工作 的 根本 目标 是 确 
保 实现 者 和 用 户 只 需 面 对 单一 的 C++ 定义 。 从 1998 年 开始 ， 程 序 员 可 以 依赖 ISO C++98 标 
准 ， nme mie 

不 幸 的 是 ， 经 常会 发 生 开始 学 习 C++ 时 使 用 的 却 是 5 年 前 的 C++ 实现 的 情况 。 一 个 典 
pe i et es 如 果 可 以 选择 的 话 ， 专 业 人 员 不 会 使 用 这 种 
古老 的 C++ 实现 。 而 且 ， 当 前 很 多 品质 跟 得 上 时 代 的 C++ 实现 也 都 可 以 免费 获得 。 对 初学 
者 而 言 ， 使 用 旧版 本 C++ 实现 会 有 严重 的 隐 含 代价 。 缺 乏 一 些 新 的 语言 特性 和 库 支 持 使 得 
初学 者 不 得 不 与 新 版 本 中 已 不 存在 的 问题 斗争 。 使 用 一 个 特性 匮乏 的 旧版 本 实现 ， 特 别 是 如 
果 学 习 的 还 是 一 本 古老 的 教材 ， 会 令 初学 者 形成 扭曲 的 编程 风格 、 对 C++ 产生 曲解 。 最 适 
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合 初 学 的 C++ 子 集 不 是 低层 特性 集合 (也 不 是 C 和 C++ 的 公共 子 集 ; 见 1.3 节 )。 特 别 是 ， 
为 了 方便 学 习 并 对 C++ 编程 是 什么 有 一 个 正确 的 第 一 印象 ， 我 推荐 初学 的 内 容 应 着 重 标准 
库 ， 并 大 量 使 用 类 、 模 板 和 异常 。 

仍 有 一 些 场景 ，C 是 优 于 C++ 的 。 如 果 必 须 使 用 C， 应 使 用 C 和 C++ 的 公共 子 集 编写 
程序 。 这 样 ， 你 就 能 获得 一 些 类 型 安全 的 支持 、 提 高 可 移植 性 并 准备 好 在 条 件 允 许 时 迁移 到 
C++。 参 见 1.3.3 节 。 

只 要 条 件 允 许 ， 就 应 使 用 遵循 标准 的 C++ 实现 ， 并 尽量 减少 对 具体 实现 的 特有 特性 和 
语言 标准 未 定义 特性 的 依赖 。 设 计时 应 以 完整 语言 标准 都 可 用 为 前 提 ， 只 在 迫不得已 时 才 使 
用 变通 方法 。 相 对 于 基于 “最 小 公分 母 ” 式 的 C++ 子 集 的 设计 ， 这 种 遵循 完整 标准 的 设计 
会 带 来 更 好 的 程序 组 织 和 更 易 维护 的 代码 。 此 外 ， 只 在 必要 时 使 用 具体 实现 特有 的 语言 扩 
展 。 参见 1.3.2 节 。 


44.3 C/C++ 兼容 性 


除 少 数 例 外 ，C++ 可 视 为 C (这 里 是 指 C11， 由 ISO/IEC 9899:2011(E) 定义 ) 的 一 个 超 
集 。 两 者 的 大 多 数 差 异 都 源 于 C++ 对 类 型 检查 的 极度 强调 。 编 写 良 好 的 C 程序 也 很 容易 成 
为 合格 的 C++ 程序 。 编 译 器 能 诊断 C++ 和 C 的 每 处 不 同 。C99 和 C++11 不 兼容 之 处 都 列 在 
iso.C 中 。 在 本 书 (英文 原版 ) 写作 过 程 中 ，C11 还 非常 新 ， 大 多 数 C 代码 都 是 遵循 经 典 C 
或 C99 的 。 


44.3.1 C 和 C++ 是 兄弟 


经 典 C 有 两 个 主要 后 代 : ISO C 和 ISO C++。 多 年 以 来 ， 两 种 语言 在 以 不 同 的 步调 沿 着 
不 同 的 方向 发 展 。 造 成 的 一 个 结果 就 是 它们 都 支持 传统 C 风格 编程 ， 但 支持 的 方式 有 着 细 
微 不 同 。 所 产生 的 不 兼容 会 使 某 些 人 非常 苦恼 一 一 同时 使 用 C 和 C++ 的 人 、 使 用 一 种 语言 
编写 程序 但 用 到 另 一 种 语言 编写 的 库 的 人 以 及 为 C 和 C++ 编写 库 与 工具 的 人 。 

为 何 会 说 C 和 C++ 是 兄弟 呢 ? 毕竟 C++ 很 明显 是 C 的 后 代 。 但 是 ， 请 看 下 面 简化 后 的 
家 谱 : 





1967 Simula BCPL 
,| 
\ 7 
时 1 1 , 
1978 \ ;经 典 C 
和 1; 
| ’ Classic C 


1980 


1985 





1989 
ss 
1998 Crr98 ~ c99 


a 
2011 C++11 和 Cll 
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在 此 图 中 ， 实 线 表示 大 量 特 性 的 继承 ， 短 杠 虚 线 表 示 主 要 特性 的 借用 ， 而 点 虚线 表示 次 要 
特性 的 借用 。 从 中 可 以 看 出 ，ISO C 和 ISO C++ 是 K&R C 的 两 个 主要 后 代 ， 因 此 它们 是 兄 
弟 。 两 者 在 发 展 过 程 中 都 从 经 典 C 继承 了 关键 特性 ,但 又 都 不 是 100% 兼容 经 典 C。“ 经 典 
C” 一 词 是 我 从 Dennis Ritchie 的 显示 器 上 贴 的 便条 中 挑 出 来 的 。 它 大 致 相当 于 K&R C 加 上 
枚 举 和 struct 赋值 两 个 特性 。 

不 兼容 对 程序 员 来 说 是 璐 梦 ， 部 分 原因 是 它 会 造成 选择 上 的 组 合 爆炸 。 考 虑 下 面 简单 的 
维 恩 图 解 : 





几 个 区 域 是 不 成 比例 的 。C++11 和 C11 都 包含 大 部 分 K&R C 特性 ，C++11 又 包含 C11 的 大 
部 分 特性 。 但 大 多 数 特性 都 有 明确 的 归属 ， 例 如 : 


C89 独 有 调用 未 声明 的 函数 

C99 独 有 可 变 长 度数 组 (variable-length arrays, VLA) 
C++ 独 有 模板 

C89 和 C99 拥有 Algol 风格 函数 定义 

C89 和 C++ 拥有 将 C99 关键 字 restrict 作为 标识 符 

C++ 和 C99 拥有 // 注释 

C89、C++ 和 C99 拥有 struct 

C++11 独 有 移动 语义 (使 用 右 值 引用 &&) 

Cll 独 有 泛 型 表达 式 使 用 _Generic 关键 字 

C++ll 和 C11 拥有 原子 操作 


注意 ，C 和 C++ 的 差别 并 不 一 定 是 C++ 在 演化 过 程 中 对 C 特性 做 出 改变 的 结果 。 有 很 多 不 
兼容 的 例子 是 将 在 C++ 中 已 存在 很 久 的 特性 引入 C 时 产生 的 。 例 如 ，T* 到 void* 的 赋值 以 
及 全 局 const 的 连接 [ Stroustrup ,2002 ]。 有 时 一 个 特性 都 已 经 成 为 ISO C++ 标准 的 一 部 分 ， 
才 被 引入 C 并 产生 不 兼容 ， 例 如 inline 的 含义 。 
44.3.2 “静默 ”差异 

除了 少数 例外 ， 同 时 符合 C++ 和 C 标准 的 程序 在 两 种 语言 中 具有 相同 的 含义 。 幸 运 的 
是 ， 这 些 例外 (通常 被 称 为 静默 差异 ，silent difference) 很 不 常用 : 

。 在 C 中， 字符 常量 和 枚 举 值 的 大 小 等 于 sizeof(int)。 在 C++ 中，sizeof('a") 等 于 

Sizeof(char)。 


e 在 C 中 ， 一 个 枚 举 值 是 一 个 int， 而 C++ 实现 可 以 选择 枚 举 值 占用 多 大 空间 最 合适 
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( 见 8.4.2 节 )。 
e 在 C++ 中 ， 一 个 struct 的 名 字 进 入 其 声明 所 在 的 定义 域 ; 在 C 中 则 不 是 这 样 。 因 此 ， 
定义 于 内 层 作 用 域 中 的 C++ struct 名 字 在 外 层 作 用 域 中 是 可 以 被 隐藏 的 。 例 如 : 
int x[99]; 
void f() 
{ 
struct x { int a; }; 
sizeof(x); 产 在 C 中 获得 数组 大 小 ， 在 C++ 中 获得 struct 大 小 */ 
sizeof(struct x); 产 struct 大 小 刘 


} 


44.3.3 不 兼容 C++ 的 C 代码 


引发 大 多 数 实际 问题 的 C/C++ 不 兼容 之 处 并 不 微妙 ， 大 多 数 很 容易 被 编译 器 所 捕获 。 
本 节 给 出 一 些 不 兼容 C++ 的 C 代码 示例 ， 以 现代 C 的 标准 衡量 ， 其 中 大 多 数 都 是 风格 糟糕 
甚至 应 该 被 淘汰 的 。 不 兼容 特性 的 完整 列表 请 见 iso.C。 

e 在 C 中 ， 大 多 数 函 数 剖 可 以 不 声明 即 调 用 。 例 如 : 


int main() 人 不 兼容 Ctt; 也 是 风格 糟糕 的 C 代码 
{ 





double sq2 = sqrt(2); 广 调用 未 声明 的 函数 */ 

printf("the square root of 2 is %g\n",sq2); 启 调 用 未 声明 的 函数 */ 
} 
完整 一 致 地 使 用 函数 声明 (函数 原型 ) 通常 是 推荐 的 C 代码 编写 风格 。 当 此 合理 建 
议 被 遵循 时 ， 特 别 是 当 CC 编译 器 提供 了 选项 来 强制 这 一 点 时 ，C 代码 就 会 符合 C++ 
规则 。 当 调用 未 声明 的 函数 时 ， 就 必须 对 函数 和 C 的 规则 非常 了 解 ， 而 且 知 道 是 否 
犯 了 错 或 引入 了 可 移植 性 的 问题 。 例 如 ， 上 面 这 个 main() 函数 就 包含 至 少 两 个 不 符 
合 C 规则 的 错误 。 

e 在 C 中， 如 果 声 明 一 个 函数 时 未 指定 参数 类 型 ， 则 可 以 用 任意 数目 、 任 意 类 型 的 实 

参 调 用 它 。 
void f(); 产 未 说 明 参 数 类 型 ?/ 





void g() 
f(2); 六 不 兼容 Ct+; 也 是 风格 糟糕 的 C 代码 */ 
} 
这 种 用 法 在 ISO C 中 已 被 淘汰 了 。 
e 在 C 中 ， 函数 定义 允许 在 参数 列表 后 〈 可 选 地 ) 说 明 参 数 类 型 的 语法 : 
void f(a,p,c) char *p; char c; {/* ... */} 六 不 兼容 C++ 的 C 代码 3 
这 样 的 定义 必须 改写 为 : 
void flint a, chary p, char c) {/°... */} 
。 在 C 中 ， 可 以 在 返回 类 型 和 参数 类 型 的 声明 中 定义 struct。 例 如 : 


struct S { int x,y; } f(); 闫 不 兼容 C++ 的 C 代码 纪 
void g(struct S { int x,y; } y); 广 不 兼容 CtHH+ 的 C 代码 */ 


使 用 C++ 的 类 型 定义 规则 ， 上 面 这 种 声明 方式 就 没有 用 处 了 ， 也 不 再 允许 了 。 
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。 在 C 中 ， 可 以 将 整数 赋予 枚 举 类 型 变量 : 


enum Direction { up, down }》; 
enum Direction d = 1; 上 错误 : 将 int 赋予 Direction; 在 C 中 是 正确 的 */ 


C++ 提供 了 比 C 多 得 多 的 关键 字 。 如 果 在 一 个 C 程序 中 使 用 了 C++ 关键 字 作 为 标识 
符 ， 则 必须 改名 才能 成 为 合法 的 C++ 程序 : 








非 C 关键 字 的 C++ 关键 字 
alignas alignof and and_ed asm bitand 
bitor bool catch char16 ft char32 ft class 
compl const_cast constexpr decltype delete dynamic_cast 
explicit false friend inline mutable namespace 
new noexcept not not_eq nullptr operator 
or_ eq private protected public reinterpret_cast static_assert 
static_cast template this thread_local throw true 
try typeid typename using virtual wchar_t 


xor xor_eq 





此 外 ,单词 export 是 保留 的 ， 未 来 可 能 作为 关键 字 。C99 采纳 了 关键 字 inline。 
在 C 中 ,一 些 C++ 关 键 字 是 定义 在 标准 头 文件 中 的 宏 : 
and and_eq bitand bitor bool compl false not not_eq 
or or_eq true wchar_t xor xor_eq 


这 意味 着 在 C 中 可 以 使 用 #ifdef 对 它们 进行 检测 、 重 定义 等 。 

在 C 中 ， 无 需 使 用 说 明 符 extern 即 可 在 单一 编译 单元 中 多 次 声明 一 个 全 局 数据 对 
象 。 只 要 其 中 最 多 一 个 声明 提供 了 初始 化 器 ， 此 对 象 就 被 认为 只 定义 了 一 次 。 例 如 : 
int i; 

inti; /* 整 型 变量 “i” 的 另 一 个 声明 而 已 ; 不 兼容 C++ 对 

在 C++ 中 ， 一 个 实体 只 能 定义 一 次 ; 见 15.2.3 节 。 

在 C 中， 一 个 void* 可 用 作 赋 值 操作 的 右 侧 运算 对 象 或 任意 指针 类 型 对 象 的 初始 化 
值 ; 在 C++ 中 则 不 行 ( 见 7.2.1 节 )。 例 如 : 





void flint n) 
{ 
int*s p = malloc(n*sizeof(int)); /* 不 兼容 C++; 在 C++， 用 “new” 分 配 空间 */ 
} 
这 可 能 是 最 棘手 的 一 个 不 兼容 问题 。 注 意 ，void* 到 其 他 指针 类 型 的 隐 式 转换 通常 并 
非 无 害 : 
char ch; 
void* pv = &ch, 
int* pi = pv; /| 不 兼容 C++ 
*pi = 666; 儿 覆盖 了 ch 及 接近 ch 的 其 他 字 节 


如 果 同 时 使 用 两 种 语言 ， 应 将 malloc() 的 返回 结果 显 式 转换 为 正确 类 型 。 如 果 只 是 
用 C++， 则 不 要 使 用 malloc()。 





e 在 C 中 ， 字 符 串 字 面值 常量 的 类 型 是 “ char 数 组”， 但 在 C++ 中 则 是 “ const char 


数组 ”， 于 是 : 
char* p = "a string literal is not mutable"; ”在 C++ 中 是 错误 的 ; 在 C 中 是 正确 的 
p[7]="d’; 


e C 允许 控制 流转 向 一 个 标号 语句 (switch 或 goto ; 见 9.6 节 ) 来 绕 过 初始 化 ; 在 C++ 
中 则 不 行 。 例 如 : 
goto foo; 外 C 中 正确 ; C++ 中 错误 


/1 

{ 
intx = 1; 

foo: 
if (x!=1) abort(); 
| 

} 


e 在 C 中， 全 局 const 默认 具有 外 部 链接 ; 在 C++ 中 则 不 是 ， 必 须 进 行 初始 化 ， 除 非 
显 式 声明 了 extern ( 见 7.5 节 )。 例 如 ; 


const int ci; 外 在 C 中 是 正确 的 ; 在 C++ 中 产生 一 个 const 未 初始 化 错误 
e 在 C 中 ， 崔 套 结构 的 名 字 与 外 层 结构 的 名 字 位 于 相同 的 作用 域 。 例 如 : 
struct S{ 


struct T{/*...*/}t; 
hi 
}; 


struct T x; 咱 C 中 是 正确 的 ; 表示 “S:Tx;” 在 C++ 中 是 错误 的 


。 在 C++ 中 ， 类 名 位 于 其 声明 所 在 的 作用 域 ， 因 此 不 能 与 同一 作用 域 中 其 他 类 型 的 声 
明 同 名 。 例 如 : 


struct X{/*...*/}; 


typedef int X; 儿 C 中 正确 ; C++ 中 错误 

e 在 C 中， 数组 初始 化 器 的 元 素数 目 可 以 超过 数组 大 小 。 例 如 : 
char v[5] = "Oscar"; 儿 C 中 正确 ， 结 尾 0 未 使 用 ; C++ 中 错误 
printf("%s",v); /很 可 能 导致 一 场 灾难 


44.3.3.1 “经 暴 C” 问 题 
假如 需要 升级 经 典 C 程序 (“K&R C”) 或 C89 程序 ， 还 会 出 现 其 他 一 些 问题 : 
e C89 没有 // 注释 (虽然 大 多 数 C89 编译 器 增加 了 对 这 种 注释 的 支持 ): 
int x; 川 不 是 C89 程序 
e 在 C89 中 ， 类 型 说 明 符 默认 为 int (被 称 为 “ 隐 式 int”)。 例 如 : 
consta=7; * 在 C89 中 ， 认 为 类 型 是 int; 在 C++ 或 C99 中 不 是 这 样 */ 
f() Af0) 的 返回 类 型 默认 为 int; C++ 或 C99 中 不 是 3 
{ 
fs 
} 


44.3.3.2 ”未 被 C++ 采纳 的 C 特性 
经 慎重 考虑 ， 一 些 C99 新 特性 (与 C89 相 比 ) 未 被 C++ 采纳 : 
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[1】 可 变 长 度数 组 (VLA); 可 改 用 vector 或 某 种 形式 的 动态 数组 ; 

[2 ] 指定 初始 化 器 ; 可 改 用 构造 函数 。 

C11 特性 还 太 新 ， 除 了 那些 来 自 于 C++ 的 特性 ， 如 内 存 模 型 和 原子 操作 ( 见 41.3 节 ) 
外 ， 其 他 特性 尚未 被 C++ 标准 考虑 是 否 接纳 。 


44.3.4 不 兼容 C 的 C++ 代码 


本 节 列 出 C++ 提供 但 C 不 提供 的 特性 (或 引入 C++ 多 年 后 才 被 C 采纳 的 特性 ， 因 此 在 
旧版 本 C 编译 器 中 可 能 缺失 )。 这 些 特 性 按 用 途 进 行 了 排序 。 但 是 ， 还 存在 其 他 很 多 分 类 方 
式 ， 而 且 大 多 数 特性 都 有 多 个 用 途 ， 因 此 不 要 太 看 重 本 节 中 给 出 的 分 类 。 

e 主要 用 来 提高 符号 表示 便利 性 的 特性 : 

[1] /注释 ( 见 2.2.1 节 和 9.7 节 ) 已 加 入 C99; 

对 受 限 字符 集 的 支持 ( 见 iso.2.4); 已 部 分 加 入 C99; 
对 扩展 字符 集 的 支持 ( 见 6.2.3 节 ); 已 加 入 C99; 
static 存储 中 变量 的 非常 量 初始 化 器 ( 见 15.4.1 节 ); 
常量 表达 式 中 的 const ( 见 2.2.3 节 和 10.4.2 节 ); 
声明 视 为 语句 ( 见 9.3 节 ); 已 加 入 C99; 

for 语句 初始 化 器 中 的 声明 ( 见 9.5 节 ); 已 加 入 C99; 
条 件 中 的 声明 ( 见 9.4.3 节 ); 

[9] 结构 名 无 须 加 struct 前 级 ( 见 8.2.2 节 ); 

[10] 匿名 union ( 见 8.3.2 节 ); 已 加 入 Cll。 

e 主要 用 来 增强 类 型 系统 的 特性 : 

[1] 函数 参数 类 型 检查 ( 见 12.1 节 ); 已 部 分 加 入 C ( 见 44.3.3 节 ); 
[2 ] 类 型 安全 的 链接 ( 见 15.2 节 和 15.2.3 节 ); 

[3] 用 new 和 delete 进行 自由 存储 管理 ( 见 11.2 节 ); 
[4] const ( 见 7.5 节 ); 已 部 分 加 入 Ci 

[5] 布尔 类 型 bool ( 见 6.2.2 节 ); 已 部 分 加 入 C99; 

[6] 命名 类 型 转换 ( 见 11.5.2 节 )。 

e 用 于 用 户 自 定义 类 型 的 特性 : 

[1] 类 ( 见 第 16 章 ); 

[2] 员 函 数 ( 见 16.2.1 节 ) 和 成 员 类 ( 见 16.2.13 节 ); 
构造 函数 和 析 构 函数 ( 见 16.2.5 节 和 第 17 章 ); 
派生 类 ( 见 第 20、21 章 ); 

virtual 函数 和 抽象 类 ( 见 20.3.2 节 和 20.4 节 ); 

公有 /保护 /私有 访问 控制 ( 见 16.2.3 节 和 20.5 节 ); 
friend ( 见 19.4 廊 ); 

成 员 指针 ( 见 20.6 节 ); 

[9] static 成 员 ( 见 16.2.12 节 ); 

[ 10 ] mutable 成 员 ( 见 16.2.9.3 节 ); 

[11 ] 运算 符 重 载 ( 见 第 18 章 ); 

[12] 引用 ( 见 7.7 节 )。 
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e 主要 用 于 程序 组 织 的 特性 (除了 类 之 外 ): 

[1」 模板 ( 见 第 23 章 ); 

内 联 函 数 ( 见 12.1.3 节 ); 已 加 入 C99; 
默认 实 参 ( 见 12.2.5 节 ); 

函数 重 载 ( 见 12.3 节 ); 

名 字 空 间 ( 见 14.3.1 节 ); 

显 式 作用 域 限定 符 (运算 符 ::;， 见 6.3.4 节 ); 
异常 ( 见 2.4.3.1 节 和 第 13 章 ); 

] 运行 时 类 型 识别 ( 见 第 22 章 ); 

[9] 推广 的 常量 表达 式 (constexpr; 见 2.2.3 节 、10.4 节 和 12.1.6 节 )。 
44.2 节 中 列 出 的 C++ 特性 C 都 不 支持 。 

C++ 增加 的 关键 字 ( 见 44.3.3 节 ) 可 用 于 识别 大 多 数 C++ 专 有 特性 。 但 是 ， 某 些 特性 ， 
如 函数 重 载 和 常量 表达 式 中 的 const， 通 过 关键 字 是 无 法 识别 的 。 

在 C++ 中， 函数 链接 是 类 型 安全 的 ， 而 C 对 于 函数 链接 不 要 求 类 型 安全 。 这 意味 着 在 
某 些 (大 多 数 ? ) 实现 中 ，C++ 哨 数 必须 声明 为 extern "C"， 才 能 既 使 用 C++ 编译 又 服从 C 
调用 规范 ( 见 15.2.5 节 )。 例 如 : 

double sin(double); /1 不 能 与 C 代码 链接 在 一 起 

extern "C" double cos(double); J 可 与 C 代码 链接 

我 们 可 以 用 __cplusplus 宏 判断 程序 是 被 C 编译 器 处 理 还 是 被 C++ 编译 器 处 理 ( 见 
15.2.5 节 ) 

除了 前 面 列 出 的 特性 ，C++ 库 ( 见 30.1.1 节 和 30.2 节 ) 的 大 部 分 也 是 C++ 专用 的 。C 
标准 库 在 <tgmath.h> 中 提供 了 泛 型 的 宏 ， 在 <complex.h> 中 提供 了 对 _Complex 数 的 支 
持 ， 它 与 <complex> 很 接近 。 

C 还 提供 了 <stdbool.h> ， 提 供 _Bool 类 型 和 别名 bool， 与 C++ 的 bool 很 接近 。 


44.4 建议 
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[1] 在 使 用 新 特性 编写 产品 级 代码 前 ， 应 先 尝 试 编写 小 规模 程序 来 测试 它 是 否 符合 标 
准 以 及 你 所 使 用 的 C++ 实现 是 否 满足 性 能 要 求 ; 44.1 节 。 

[2] 学 习 C++ 时 应 使 用 你 能 获得 的 最 新 的 、 最 完整 的 标准 C++ 实现 ; 44.2.4 节 。 

[3] C 和 C++ 的 公共 子 集 不 是 学 习 C++ 的 最 佳 起 点 ; 1.2.3 节 ，44.2.4 节 。 

[4] 优先 选择 标准 特性 而 不 是 非 标 准 特性 ; 36.1 节 ，44.2.4 节 。 

[5 ] 避免 使 用 throw 说 明 这 样 的 弃 用 特性 ; 44.2.3 节 ，13.5.1.3 市 。 

[6] 避免 使 用 C 风格 类 型 转换 ; 44.2.3 节 ，11.5 节 。 

[7] “ 隐 式 int” 已 被 弃 用 ， 因 此 应 显 式 说 明 每 个 函数 、 变 量 、const 等 的 类 型 ;44.3.3 
节 。 

[8] 在 将 C 程 序 转换 为 C++ 程 序 时 ， 首 先 确 保 一 致使 用 函数 声明 (原型 ) 和 标准 头 文 
件 ; 44.3.3 节 。 

[9] 在 将 C 程序 转换 为 C++ 程序 时 ， 需 将 与 C++ 关键 字 同 名 的 变量 改名 ; 44.3.3 节 。 

[ 10 ] 出 于 可 移植 性 和 类 型 安全 的 考虑 ， 如 果 必 须 使 用 C， 应 该 用 C 和 C++ 的 公共 子 


集 编写 代码 ; 44.2.4 节 。 
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[11」 在 将 C 程序 转换 为 C++ 程序 时 ， 应 将 malloc() 的 返回 结果 转换 为 正确 类 型 或 改 
用 new; 44.3.3 节 。 

[12] 当 从 malloc() 和 free() 转 换 为 new 和 delete 时 ， 考 虑 使 用 vector、push_ 
back() 和 reserve() 而 不 是 realloc(); 3.4.2 节 ，43.5 节 。 

[ 13 ] 在 将 C 程序 转换 为 C++ 程序 时 ， 记 住 C++ 中 没有 从 int 到 枚 举 类 型 的 隐 式 类 型 

转换 ; 如 需要 ， 应 使 用 显 式 类 型 转换 ; 44.3.3 节 ，8.4 节 。 

[14] 名 字 空 间 std 中 定义 的 特性 都 是 定义 于 一 个 文件 名 无 后 缀 的 头 文件 中 (如 

std::cout 声明 于 <iostream> 中 ); 30.2 节 。 

[15] 包含 <string> 以便 使 用 std::string (<string.h> 中 都 是 C 风 格 字 符 串 函数 ) ; 

15.2.4 节 。 

[16] 每 个 标准 C 头 文件 <X.h> 都 将 名 字 置 于 全 局 名 字 空 间 中 ， 对 应 的 C++ 头 文件 

<CX> 将 名 字 置 于 名 字 空 间 std 中 ; 15.2.2 节 。 

[17] 声明 C 函数 时 使 用 extern “C"; 15.2.2 节 。 
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代 的 C++ 经 典 力作 。 

新 的 C++11 标 准 使 得 程序 员 能 以 更 清晰 、 更 简明 、 更 直接 的 方式 表达 思想 ， 从 而 编写 出 更 快速 和 高 效 
的 代码 。 在 最 新 出 版 的 第 4 版 中 ，Stroustrup 博 十 针对 最 新 的 C++11 标 准 ， 为 所 有 希望 更 有 效 使 用 C++ 语言 
编程 的 程序 员 重 新 组 织 、 扩 展 和 全 面 重 写 了 这 本 C++ 语言 的 权威 参考 书 和 学 习 指南 ， 细 致 、 全 面 、 综 合 地 阐 
述 了 C++ 语言 及 其 基本 特性 、 抽 象 机 制 、 标 准 库 和 关键 设计 技术 。 


新 的 C++11 标 准 的 内 容 包括 


@ 支持 并 发 处 理 。 

@ 正则 表达 式 、 资 源 管理 指针 、 随 机 数 、 改 进 的 容器 ( 包括 哈 希 表 ) 以 及 其 他 很 多 特性 。 

@ 通用 和 一 致 的 初始 化 机 制 、 更 简单 的 for 语 句 、 移 动 语义 、 基 础 的 Unicode 支 持 。 

e lambda 表 达 式 、 通 用 常量 表达 式 、 控 制 类 缺 省 定义 的 能 力 、 可 变 参数 模板 、 模 板 别名 、 用 户 定义 的 
字面 值 常量 。 

9 兼容 性 问题 。 
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